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Wstęp 


Pomimo rozlicznych prób zdyskredytowania testu Turinga okazał 
się on niesłychanie odporną propozycją na gruncie filozofii umy¬ 
słu i filozoficznych dyskusji o sztucznej inteligencji. W momencie, 
w którym filozoficzni przeciwnicy testu Turinga obwieszczają jego 
zupełne unicestwienie, on — niczym feniks z popiołów — odra¬ 
dza się wraz z nowymi obrońcami przedstawiającymi nowe tezy 
przemawiające na jego korzyść 1 . 

L. J. Crockett (1994) The Turing Test 
and the Frame Problem. AI’s Mistaken 
Understanding of Intelligence 


Mianem testu Turinga (TT) określa się propozycję gry przedstawioną przez 
Alana Turinga w jego znanym artykule „Computing Machinery and Intelli¬ 
gence”, który ukazał się w czasopiśmie Mind w roku 1950. Punktem wyjścia 
w tym tekście jest pytanie o to, czy maszyny mogą myśleć? Turingowi pytanie 
to wydaje się zbyt wieloznaczne, by zasługiwało na dyskusję, więc proponuje 
zastąpienie go innym, na które prawdopodobnie łatwiej będzie uzyskać odpo¬ 
wiedź: czy w przypadku pewnej gry maszyna poradzi sobie równie dobrze jak 
człowiek? Konstrukcję i zasady owej gry zaczerpnął Turing z gry towarzy¬ 
skiej, nazywanej grą w naśladownictwo ( imitation gamę). Biorą w niej udział 
trzy osoby: mężczyzna (A), kobieta ( B ) i pytający (C) (dowolnej płci, nazy¬ 
wany również sędzią). Mężczyzna i kobieta przebywają w osobnych pokojach, 
oddzieleni od siebie i od pytającego. Oczywiście gracze nie mogą się widzieć 
ani słyszeć, czy też pisać do siebie pismem odręcznym (mogą porozumiewać 
się np. dzięki gońcowi). Pytający może zadawać pytania osobom w pokojach, 
które to osoby zna jako X i Y. Jego zadaniem jest określenie (wyłącznie na 
podstawie uzyskanych odpowiedzi), w którym pokoju znajduje się kobieta, 
a w którym mężczyzna. Modyfikacja wprowadzona przez Turinga polega na 
zastąpieniu jednej z osób maszyną. Pisze on: „Zadajmy teraz pytanie »co 

1 Jeśli w bibliografii pracy nie zaznaczono inaczej, tłumaczenia dokonał P. Łupkowski. 
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stanie się, kiedy maszyna weźmie udział w tej grze?« Czy pytający dokona 
błędnej identyfikacji równie często, jak w przypadku, gdy w grze biorą udział 
kobieta i mężczyzna?” [Turing 1950, s. 434]. Oczywiście zadaniem pytającego 
nie jest już odgadnięcie płci jednego z graczy, ale rozpoznanie — podobnie 
jak w przypadku gry w naśladownictwo jedynie na podstawie udzielonych 
odpowiedzi który z nich jest człowiekiem, a który maszyną. Kryterium 
bycia istotą inteligentną zostaje tym samym sprowadzone do kryterium po¬ 
wodzenia w tak zaprojektowanej grze. Jeżeli pytający zidentyfikuje maszynę 
jako człowieka, uzyskamy podstawy do stwierdzenia, że owa maszyna jest 
inteligentna. 

Test Turinga zbliża się już do swoich sześćdziesiątych urodzin ale z całą 
pewnością — wbrew licznym glosom krytyków - nie stanowi dziś zagad¬ 
nienia przebrzmiałego, o którym powiedziano już wszystko, co było do po¬ 
wiedzenia. Należy jednak uczciwie przyznać, że powiedziano bardzo wiele. 
Propozycja A. M. Turinga, przedstawiona w „Computing Machinery and In- 
telligence” stanowi bowiem źródło inspiracji w wielu dyscyplinach. Zagad¬ 
nienie testu Turinga poruszane jest w pozycjach zaliczanych do psychologii 
(por. np. [Nęcka 2005], [Watt 1996]), kognitywistyki (por. np. [Konar 2000], 
[Harnish 2002], [Casacuberta 2007]), informatyki (por. np. [Tanimoto 1987], 
[Luger, Stubblefield 1998], [Thro 1994]) czy filozofii (por. np. [Searle 1995], 
[Hetmański 2000]). Test Turinga znalazł swoje miejsce również poza nauką 
w literaturze popularnej (por. np. Neuromancer Williama Gibsona) a nawet 
w muzyce (opera The Turing Test autorstwa Juliana Wagstaffa 2 ). 

Dyskusje prowadzone wokół testu Turinga nie zamykają się w ramach 
czysto teoretycznych, akademickich rozważań, ale wkraczają również na ob¬ 
szar zagadnień praktycznych. Test Turinga generuje wiele problemów, które 
umieszczają go w szerszej perspektywie rozważań dotyczących zagadnienia 
sztucznej inteligencji: 

- Czy rzeczywiście istnieje jakiś związek pomiędzy testem Turinga a po¬ 
siadaniem inteligencji? Czy test Turinga jest dobrze zaprojektowany dla 
celów, którym ma służyć? Na te pytania udzielane są rozmaite odpo¬ 
wiedzi, od stanowisk krytykujących test Turinga, poprzez próby jego 
wzmocnienia lub osłabienia, aż po glosy broniące propozycji Turinga. 

- Czy test Turinga dostarcza definicji inteligencji jako takiej? Przy pró¬ 
bie odpowiedzi na to pytanie badacze starają się wskazywać na rodzaj 
uzasadnienia tezy o inteligencji maszyn, jaki oferuje test Turinga. Czy 
mamy tu do czynienia z operacyjną definicją inteligencji, czy też może 
intencje Turinga szły w zupełnie inną stronę? 

- Czy wybór celu badań wyznaczonego przez test Turinga jest korzystny 
dla rozwoju sztucznej inteligencji jako dyscypliny? Pytanie to zazwy¬ 
czaj pojawia się w kontekście krytyki testu Turinga jako pewnego celu 
wyznaczonego dla badaczy sztucznej inteligencji — „zbuduj maszynę, 
która pod względem zachowań językowych będzie nieodróżnialna od 


2 Opera miała premierę 15 sierpnia 2007 roku. Można jej posłuchać na 
http: //www .julianwagstaff.com/ttt/music.html. 
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człowieka”. Oczywiście owa krytyka zakorzeniona jest głęboko w nega¬ 
tywnych odpowiedziach na dwa wcześniejsze pytania. 

- Czy maszyna, która zda test Turinga powinna być traktowana jak osoba 
ludzka? Odpowiedź na ten problem związana jest z całą - długą już 
— tradycją rozważań etycznych skupionych wokół zagadnienia statusu 

maszyn myślących (por. np. [Jonas 1996], [Kiepas 1992], [Łupkowski 
20056]). 

- Jak zaprojektować program, który zda test Turinga? Jest to oczywiście 
pytanie, które zadają sobie informatycy, stawiający sobie za cel stworze¬ 
nie programów zdolnych do porozumiewania się z użytkownikiem przy 
użyciu języka naturalnego. 

- Czy idea testu Turinga może pomóc w praktycznym odróżnianiu ludzi 
od maszyn? Na pytanie to — jak się wydaje, jedyne spośród wymienio¬ 
nych można już dziś udzielić odpowiedzi twierdzącej, co zrobili bada¬ 
cze zajmujący się automatycznymi systemami autoryzacji użytkownika 
(por. rozdział 4). 

Jeżeli spróbujemy prześledzić liczne próby udzielenia odpowiedzi na przed¬ 
stawione pytania, łatwo daje się zauważyć, że duża część prowadzonych dys¬ 
kusji wydaje się mocno odbiegać od tego, co można by nazwać oryginalną 
propozycją A. M. Turinga. Częste są próby rekonstruowania testu Turinga 
jedynie na podstawie „Computing Machinery...”, z zupełnym pominięciem 
późniejszych źródeł dotyczących testu. Często autorzy — zwłaszcza stano¬ 
wisk krytycznych - nie zaprzątają sobie głowy szczegółową rekonstrukcją 
testu Turinga, bazując jedynie na ogólnej jego idei (czy może lepiej, obiego¬ 
wym wyobrażeniu o nim). Taki stan rzeczy stał się dla mnie motywacją dla 
próby możliwie kompleksowego odtworzenia oryginalnych założeń testu Tu¬ 
ringa w oparciu o jak najbogatsze źródła autorstwa samego Turinga. Dzięki 
temu możliwe jest uznanie pewnych dyskusji toczonych wokół zagadnienia 
testu Turinga za bezcelowe, a nawet bezpodstawne. Można w tym kontekście 
przywołać przykład próby tak zwanego „literalnego” odczytywania „Compu¬ 
ting Machinery...”, którego zwolennicy uważają, że w rzeczywistości Turing 
zaproponował test płci (por. rozdział 1.4). Szczegółowa rekonstrukcja orygi¬ 
nalnych założeń testu Turinga oraz dyskusja z pewnymi nieporozumieniami 
spotykanymi w literaturze przedmiotu stanowią tematykę pierwszego roz¬ 
działu niniejszej książki. 

Rozdział drugi poświęcam omówieniu i skomentowaniu sporów oraz dys¬ 
kusji prowadzonych wokół testu Turinga. Podejmuję w nim próbę sklasyfi¬ 
kowania argumentów krytycznych wysuwanych wobec testu Turinga, korzy¬ 
stając przy tym z zaproponowanego przez R. Frencha rozróżnienia na tezę 
filozoficzną i tezę pragmatyczną testu Turinga. W rozdziale drugim rozwa¬ 
żam również konsekwencje pewnych wyników uzyskanych na gruncie logiki 
pytań dla zagadnienia adekwatności testu Turinga, jako pewnego kryterium 
badania obecności inteligencji w systemach sztucznych. 

Rozdział trzeci stanowi spojrzenie na test Turinga z perspektywy sędziego 
(pytającego). Podejmuję w nim próbę formalnej analizy testu z wykorzysta¬ 
niem narzędzi opracowanych w ramach inferencyjnej logiki pytań. Dzięki tej 
analizie mam nadzieję lepiej zrozumieć główne założenia dotyczące testu Tu- 
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ringa i uwidocznić rolę sędziego w przebiegu testu. Zastanowię się również nad 
istnieniem optymalnej strategii dla sędziego, która umożliwiałaby dokonanie 
trafnej identyfikacji gracza. 

W czwartym rozdziale niniejszej książki przedstawię najciekawsze, moim 
zdaniem, koncepcje teoretyczne oraz rozwiązania praktyczne, które w spo¬ 
sób bezpośredni nawiązują do idei zawartych w teście Turinga. Omówione 
zostaną propozycje testów alternatywnych względem TT: odwrócony test 
Turinga (Inverted Turing Test ) autorstwa S. Watta, Minimum Intelligence 
Signal Test autorstwa Ch. McKinstry’ego oraz test lady Lovelace (Louelace 
Test ) zaproponowany przez S. Bringsjorda. Przedstawię również praktyczną 
realizację idei testu Turinga, którą stanowi pewna klasa systemów automa¬ 
tycznej autoryzacji użytkownika powszechnie określana mianem CAPTCHA. 

Książkę kończy dodatek zawierający krótką biografię Alana Mathisona 
Turinga. 


Podziękowania 

Książka ta jest rozszerzoną i poprawioną wersją pracy doktorskiej obronio¬ 
nej w 2009 r. w Instytucie Filozofii Uniwersytetu im. Marii Curie-Skłodowskiej 
w Lublinie. 

Bardzo serdecznie dziękuję recenzentom tej pracy — prof. Adamowi Gro- 
blerowi i prof. Markowi Hetmańskiemu — a także dr. Mariuszowi Urbań¬ 
skiemu za wszelkie uwagi i sugestie, które znacząco wpłynęły na jej ostateczny 
kształt. Szczególnie pragnę podziękować mojemu promotorowi prof. Andrze¬ 
jowi Wiśniewskiemu za cierpliwość i wyrozumiałość oraz za cenne uwagi i czas 
poświęcony na długie dyskusje, dzięki którym powstała niniejsza praca. 


Rozdział 1 


Test Turinga 


1.1. Historia idei testu Turinga 


Alan Turing nie był pierwszym, który zadawał sobie pytanie o to, czy 
maszyny mogą myśleć. Pojawiło się ono, w naturalny sposób, wraz z powsta¬ 
niem maszyn, których poziom skomplikowania umożliwiał imitację pewnych 
zachowań istot żywych. Badacze zajmujący się zagadnieniem testu Turinga 
wskazują na Kartezjusza jako na tego, który pierwszy zdał sobie sprawę 
z problemu, jaki niesie ze sobą powstanie wyrafinowanych maszyn (por. 
[Gunderson 1964], [Copeland 2000], [Sterrett 2000], [Erion 2001], [Shieber 
2004], [Bringsjord 2009], [Cliomsky 2009]). Kartezjusz, zafascynowany współ¬ 
czesnymi sobie automatami, porównywał do nich zwierzęta i ciało ludzkie. 
W części V Rozprawy o metodzie pisze on: 

Nie wyda się to zgoła dziwne tym, którzy wiedząc, ile rozmaitych automatów, czyli 
poruszających się maszyn, przemyślność ludzka umie wykonać używając niewielu jeno 
części w porównaniu do wielkiej ilości kości, mięśni, nerwów, tętnic, żył i wszystkich 
innych składników, jakie są w ciele każdego zwierzęcia, uważać będą to ciało za maszynę, 
która, jako uczyniona rękami Boga, jest bez porównania lepiej obmyślona i zawiera 
w sobie ruchy bardziej godne podziwienia niż jakakolwiek stworzona przez człowieka 
[Kartezjusz 1637/1994, s. 42]. 

Zarówno zwierzęta, jak i ludzkie ciało są, zdaniem Kartezjusza, automa¬ 
tami. Tym jednak, co odróżnia człowieka od zwierząt, jest posiadanie przez 
niego duszy (którą obdarował człowieka Bóg). 

Dalej Kartezjusz pisze: 

Zatrzymałem się też tu umyślnie dla wykazania, że gdyby istniały takie maszyny, które 
miałyby narządy i zewnętrzną postać małpy lub innego jakiego bezrozumnego zwierzę¬ 
cia, nie mielibyśmy sposobu rozpoznać, że nie są one we wszystkim tej samej natury co 
owe zwierzęta [...] [Kartezjusz 1637/1994, s. 42]. 

Z odmienną sytuacją mamy jednak do czynienia w przypadku automatów, 
które miałyby naśladować ludzi: 

[...] podczas gdyby istniały maszyny, podobne do naszych ciał i naśladujące nasze 
uczynki na tyle, ile byłoby to w zasadzie samej możliwe, to mielibyśmy zawsze dwa bar¬ 
dzo pewne sposoby rozpoznania, że jeszcze dzięki temu nie byłyby one prawdziwymi 
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ludźmi. Pierwszy ten, iż nigdy nie mogłyby używać słów ani innych znaków składa¬ 
jąc je w ten sposób, jak my czynimy dla oznajmienia innym naszych myśli. Można 
bowiem pojąć, iżby maszyna tak była zrobiona, że wymawia jakieś słowa, a nawet wy¬ 
mawia ich kilka w związku z działaniem fizycznym powodującym pewne zmiany w jej 
przyrządach: jak to, kiedy się ją dotknie w jakimś miejscu, aby spytała czego sobie 
od niej życzymy; w innym, aby krzyczała, że ją boli, i tym podobne; ale niemożliwe 
jest, aby składała rozmaicie słowa, odpowiadając do sensu na wszystko, co się powie w 
jej obecności, jak to ludzie bodaj najbardziej tępi mogą czynić. Drugi sposób jest ten: 
choćby nawet maszyny takie czyniły wiele rzeczy równie dobrze lub może lepiej niż któ¬ 
rykolwiek z nas, nie robiłyby niezawodnie wielu innych, i przez to można by odkryć, iż 
nie działają dzięki świadomości, lecz jedynie dzięki rozmieszczeniu swoich przyrządów. 
Podczas bowiem gdy rozum jest to instrument wszechstronny, który może służyć we 
wszelkiego rodzaju przypadkach, te przyrządy potrzebują pewnego szczególnego usta¬ 
wienia dla każdej poszczególnej czynności; skąd pochodzi, że zasadniczo niemożliwe jest, 
aby w maszynie była dostateczna ich rozmaitość, by mogły ją wprawić w działanie we 
wszystkich okolicznościach życia w taki sam sposób, w jaki nasz rozum powoduje nasze 
działanie [Kartezjusz 1637/1994, s. 42—43]; wyróżnienia P.Ł. 

Powyższy fragment Rozprawy o metodzie zawiera propozycję kryteriów, 
odróżniających automaty (w tym również zwierzęta) od ludzi. G. Erion [2001] 
nazywa tę propozycję kartezjańskim testem automatyzmu ( The Cartesian 
Test for Automatism). Jak łatwo zauważyć, składa się on z dwóch elementów: 
testu językowego ( language test ) i testu działań ( action test) (por. [Gunderson 
1964, s. 198]). 

Test językowy opiera się na założeniu, że automat nigdy nie będzie w sta¬ 
nie opanować ludzkiej mowy, ponieważ jest ona zbyt wyrafinowana i złożona. 
Nawet jeśli moglibyśmy sobie wyobrazić, że udałoby się skonstruować auto¬ 
mat, który potrafiłby naśladować pewne elementy ludzkiej mowy, to i tak 
z łatwością można by odróżnić jego wypowiedzi od wypowiedzi człowieka. Po 
pierwsze, nie jest możliwe, żeby maszyna poradziła sobie z wielością konteks¬ 
tów dowolnego, realistycznego dialogu między ludźmi. Po drugie, pozbawione 
ludzkiego umysłu automaty nie mogą w rozmowie wyrażać swoich własnych 
myśli, tak jak robią to ludzie. Po trzecie wreszcie, automatom nie przysługuje 
„rzeczywista mowa”, jak określa Kartezjusz możliwość wyrażania abstrakcyj¬ 
nych myśli (np. o matematyce). Automaty mogą więc jedynie naśladować 
ludzką mowę (czy też posługiwać się pewnymi jej elementami), ale nigdy nie 
będzie możliwe, żeby takie naśladownictwo dorównało poziomowi oryginału. 

Test działań opiera się na założeniu, że ludzie, podejmując działanie, po¬ 
stępują wedle zasad, o których mogą rozumować, mogą je oceniać i zmieniać 
w zależności od swoich planów. Automaty — co Kartezjusz pokazuje na przy¬ 
kładzie zwierząt — mogą jedynie trzymać się wyznaczonych reguł i zadanych 
strategii. Innymi słowy, test działań opiera się na obserwacji elastyczności za¬ 
chowań w zmieniających się warunkach i środowisku. Automat będzie zawsze 
radził sobie albo zbyt dobrze (np. jeżeli chodzi o zadania arytmetyczne), albo 
zbyt słabo, aby uznano go za człowieka (oczywiście bardziej prawdopodobna 
jest ta druga klasa przypadków). 

Z propozycją Kartezjusza wiąże się ważne pytanie: czy automat powinien 
przejść oba etapy testu pozytywnie, czy też wystarczy powodzenie w jednym 
z nich, aby uznać, że ów automat jest inteligentny. Nasuwającym się rozwią¬ 
zaniem jest uznanie obu etapów testu za w pewnym sensie równie istotne. 


1.1. Historia idei testu Turinga 
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Zarówno w teście językowym, jak i w teście działań badane są zachowania sys¬ 
temu (czy to pod względem jego wypowiedzi, czy też innych behawioralnych 
kryteriów). Ciekawą interpretację proponuje w tym kontekście G. Erion. Jego 
zdaniem na test działań powinniśmy patrzeć jako na test posiadania własno¬ 
ści, którą określa on mianem zdrowego rozsądku (common sense). Pod tym 
pojęciem Erion rozumie: 

[...] elementarną wiedzę o zdroworozsądkowo pojmowanej rzeczywistości, która umoż¬ 
liwia nam przetrwanie i ułatwia funkcjonowanie w codziennym życiu. Powszechnie ży¬ 
wione przekonania dotyczące zdroworozsądkowo pojmowanego świata stanowią najbar¬ 
dziej znaczący komponent tej elementarnej wiedzy [Erion 2001, s. 33]. 

Jeżeli zgodzimy się z takim stanowiskiem, to test językowy staje się w pew¬ 
nym sensie częścią testu działań. 

Automaty różnią się od ludzi w dwóch kwestiach. Po pierwsze, automaty nie mogą 
używać języka. Po drugie, automaty nie posiadają zdrowego rozsądku (common sense), 
na który składa się nie tylko wiedza dotycząca używania języka, ale również wiedza 
o tym, jak wykonywać pewne zadania czy też odpowiadać na zadane pytania, na które 
nawet nieco nierozgarnięty dorosły człowiek jest w stanie odpowiedzieć. Mówiąc inaczej, 
automatom brak zdrowego rozsądku (common sense), a tym samym tej jego części, 
która związana jest z kompetencją językową [Erion 2001, s. 36]. 

Kartezjański test automatyzmu wyprzedza tym samym rozważania bada¬ 
czy współcześnie zajmujących się testem Turinga. Daje się zauważyć wyraźną 
analogię między kartezjańskim testem działań a propozycją poszerzenia testu 
Turinga autorstwa S. Harnada (por. rozdział 2). Podobnie jest, jeśli chodzi 
o kartezjański test językowy i — oparty na tzw. pytaniach subkognitywnych 
argument R. Frencha wymierzony w test Turinga (por. rozdział 2). Można 
również znaleźć podobieństwo pomiędzy założeniami leżącymi u podstaw kar- 
tezjańskiego testu działań a tzw. zarzutem lady Lovelace rozpatrywanym 
przez A.M. Turinga w „Computing Machinery...” (por. rozdział 2) oraz te¬ 
stem lady Lovelace zaproponowanym przez S. Bringsjorda (por. rozdział 4). 

Sam Kartezjusz udziela negatywnej odpowiedzi na pytanie, czy — w sen¬ 
sie zaproponowanych kryteriów — maszyny mogłyby myśleć. Warto jednak 
wspomnieć o myślicielu, którego poglądy byłyby z całą pewnością bliższe 
Turingowi — o J.O. La Mettriem. W Człowieku maszynie pisze on bowiem: 

Można być maszyną, a zarazem czuć, myśleć, odróżniać dobro od zła równie dobrze jak 
barwę niebieską od żółtej — innymi słowy, można posiadać wrodzoną inteligencję i mo¬ 
ralność, pozostając jednocześnie tylko zwierzęciem: tkwi w tym nie większa sprzeczność 
niż w fakcie, że można być małpą albo papugą i doznawać rozkoszy [...]. Moim zdaniem, 
myślenie jest tak dalece nieodłączne od materii zorganizowanej, że wydaje się ono jej 
właściwością w równym stopniu jak elektryczność, zdolność ruchu, nieprzenikliwość, 
rozciągłość itd. [La Mettrie 1748/1984, s. 84], 

Wnioskujemy zatem śmiało, że człowiek jest maszyną i że w całym wszechświecie istnieje 
tylko jedna substancja, występująca w rozmaitych postaciach [La Mettrie 1748/1984, 
s. 91]. 

Stanowisko La Mettriego motywowane było odkryciami dotyczącymi świa¬ 
ta zwierząt, ale przede wszystkim zachwytem nad możliwościami ówczesnej 
techniki. Wydaje się, że propozycja testu Turinga i optymizm jego autora co 
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1. Test Turinga 


do stworzenia myślących maszyn wyrastają z takich samych pobudek. Wnio¬ 
sek taki nasuwa się, gdy prześledzimy proces, jaki doprowadził Turinga do 
sformułowania propozycji znanej dziś jako test Turinga. Jednym z problemów, 
które szczególnie zajmowały Turinga, było zagadnienie obliczalności. Badania 
nad tym zagadnieniem doprowadziły go do sformułowania pojęcia maszyny 
Turinga (MT). Owa abstrakcyjna maszyna jest ogólnym modelem oblicza¬ 
nia, o którym mówi się również, że jest abstrakcyjnym modelem komputera 
(por. [Aho et al. 2003], [Hopcroft, Ullman 2003], [Papadimitriou 2002]). Jed¬ 
nym z rodzajów maszyn Turinga są tak zwane uniwersalne maszyny Turinga 
(UMT), które charakteryzują się tym, że mogą naśladować dowolną inną MT. 
Turing pisze: 

W celu umożliwienia naszemu komputerowi imitowania danej maszyny jedyne, co mu¬ 
simy zrobić, to tak zaprogramować ów komputer aby obliczył, co rozważana przez nas 
maszyna zrobiłaby w danych okolicznościach (w szczególności, jakie odpowiedzi by wy¬ 
drukowała). Odpowiednio zaprogramowany komputer zdolny będzie do udzielania ta¬ 
kich samych odpowiedzi [Turing 1951 a, s. 2]; wyróżnienie P.Ł. 


Imitacja jednej maszyny przez drugą polega więc nie tyle na odwzorowy¬ 
waniu jej wewnętrznej budowy, ile na naśladowaniu jej funkcji. Jeśli dodamy 
do tego fascynację Turinga możliwościami UMT i jego przekonanie o tym, że 
stany UMT można porównywać do stanów umysłu, a budowanie fizycznego 
komputera do budowania mózgu (por. [Hodges 1998, s. 48], [Hodges 1992, 
s. 290]), poszerzenie zakresu imitacji wydaje się naturalnym krokiem: 

Jeśli teraz pewną maszynę mielibyśmy opisać jako mózg, jedyne co musielibyśmy zrobić 
to tak zaprogramować ów komputer cyfrowy aby ten mózg imitował. Jeżeli przyjmiemy, 
że rzeczywiste mózgi [...] są w pewnym sensie maszynami, to następstwem tego będzie 
uznanie, że — odpowiednio zaprogramowany komputer cyfrowy — będzie się zachowy¬ 
wał jak mózg [Turing 1951 a, s. 2]; wyróżnienie P.Ł. 

Turing zwraca uwagę na fakt, że tym, co jest imitowane, są zachowania 
(funkcje) mózgu, nie zaś jego wewnętrzna struktura. W wywiadzie dla BBC 
z 1952 roku wyraził swoją opinię na ten temat w następujący, barwny sposób: 

Najważniejszą sprawą jest aby spróbować wytyczyć linię oddzielającą właściwości mó¬ 
zgu człowieka, o których chcemy dyskutować od tych, które nas nie interesują. Weźmy 
skrajny przypadek, nie interesuje mnie to, że mózg ma konsystencję zimnej owsianki. 
Nie powiemy przecież: „Ta maszyna jest całkiem twarda, czyli nie jest mózgiem, a więc 
nie może myśleć” [Newman et al. 1952, s. 3-4]. 

Przy takim rozumieniu naśladowania umysłu ludzkiego przez maszynę 
w naturalny sposób musimy się zgodzić, że nie będziemy oceniali jej we¬ 
wnętrznej struktury, ale obserwowalne zachowanie maszyny, czy też, mówiąc 
dokładniej, stopień jego podobieństwa do zachowania człowieka w tej samej 
sytuacji. Turing pisze na ten temat: 

Jestem przekonany, że można skonstruować takie maszyny, które będą bardzo dokładnie 
symulowały działanie ludzkiego umysłu. Od czasu do czasu będą popełniały błędy i od 
czasu do czasu będą w stanie produkować nowe i interesujące stwierdzenia, zaś całość ich 
werbalnych zachowań będzie równie warta uwagi jak werbalne zachowania produkowane 
przez ludzki umysł [Turing 19516, s. 2]. 


1.2. Rekonstrukcja oryginalnych założeń testu Turinga 
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Jeżeli zgodzimy się z takim poglądem dotyczącym maszyn, jedyne czego 
potrzebujemy, to rodzaj testu (ze szczegółowo określonymi warunkami jego 
przeprowadzenia), który umożliwi nam badanie stopnia interesującego nas 
podobieństwa pomiędzy zachowaniem maszyny i człowieka. Zarys takiej pro¬ 
pozycji znajdujemy już w raporcie Turinga napisanym w 1948 roku dla The 
National Physical Laboratory. Nosi on tytuł „Intelligent Machinery” i uwa¬ 
żany jest za pierwszy manifest idei sztucznej inteligencji (por. [Copeland 
2000], [Copeland, Proudfoot 2009]j. 1 Tekst kończy opis pewnego ekspery¬ 
mentu, który w nieco zmodyfikowanej i uogólnionej formie przedstawi Turing 
w „Computing Machinery and Intelligence”. 

Możliwe jest przeprowadzenie pewnego eksperymentu [...] nawet przy obecnym stanie 
wiedzy. Opracowanie papierowej maszyny 2 , która całkiem dobrze radziłaby sobie z grą 
w szachy nie powinno być trudne. Do eksperymentu potrzebujemy trzech ludzi A, B, 
C. A i C powinni być raczej marnymi graczami szachowymi, zaś B będzie papierową 
maszyną (w celu zapewnienia rozsądnego tempa pracy byłoby dobrze, żeby był on za¬ 
równo matematykiem, jak i szachistą). Wykorzystujemy dwa pokoje, pomiędzy którymi 
zapewniono możliwość komunikacji. C gra albo z A, albo z papierową maszyną. W tej 
sytuacji może się okazać, że C będzie miał duże trudności z odgadnięciem z kim w rze¬ 
czywistości gra w szachy. (Jest to raczej wyidealizowana forma eksperymentu, który 
rzeczywiście przeprowadziłem) [Turing 1948, s. 37]. 


1.2. Rekonstrukcja oryginalnych założeń testu Turinga 


Większość dyskusji i sporów wokół testu Turinga (TT) opiera się na naj¬ 
bardziej znanym z tekstów A. M. Turinga — „Computing Machinery and 
Intelligence” opublikowanym w czasopiśmie Mind w roku 1950. To właśnie 
w tym artykule Turing po raz pierwszy przedstawił w rozwiniętej formie 
ideę TT. W niniejszej analizie testu Turinga będę brał pod uwagę również 
następujące (mniej znane) teksty: „Intelligent Machinery” (raport dla The 
National Physical Laboratory z 1948), „Can Digital Computers Think” (wy¬ 
wiad radiowy wyemitowany w 1951 roku), „Intelligent Machinery, a Heretical 
Theory” (wykład wygłoszony w roku 1951), „Can automatic calculating ma- 
chines be said to think?” (wywiad radiowy wyemitowany w 1952 roku) oraz 
„Digital Computers Applied to Games” (tekst z tomu Faster than thought 
pod redakcją B. V. Bowdena, który ukazał się w 1953 roku). 

Test Turinga powstał na bazie pewnej gry towarzyskiej, nazywanej grą 
w naśladownictwo (imitation gamę). W grze tej biorą udział trzy osoby: męż¬ 
czyzna (A), kobieta ( B ) i pytający — C (dowolnej płci). Mężczyzna i kobieta 
przebywają w osobnych pokojach, oddzieleni od siebie i od pytającego. Py¬ 
tający może zadawać pytania osobom w pokojach, które to osoby zna jako 


1 Turing poruszył w nim zagadnienia, które dzisiaj zaliczane są do obszaru automatycz¬ 
nego dowodzenia twierdzeń, problem sohiing , algorytmów genetycznych oraz sztucznych 
sieci neuronowych (por. [Copeland 2000, s. 520], [Copeland, Proudfoot 2009, s. 120]). 

2 Pod pojęciem „papierowej maszyny” (paper machinę) Turing rozumiał osobę wykonu¬ 
jącą zadany algorytm przy użyciu kartki i ołówka (musimy pamiętać, że w 1948 roku nie 
było jeszcze komputerów, które mogłyby wykonywać np. algorytm gry w szachy). 
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1. Test Turinga 


X i Y. Jego zadaniem jest określenie (wyłącznie na podstawie uzyskanych 
odpowiedzi), w którym pokoju znajduje się kobieta, a w którym mężczy¬ 
zna. Gracz A w trakcie gry ma robić wszystko, aby wprowadzić pytającego 
w błąd, tak aby ten dokonał nietrafnej identyfikacji może zatem swobodnie 
kłamać, zaś B ma udzielać zawsze prawdziwych odpowiedzi. 

Punktem wyjścia dla rozważań Turinga jest pytanie o to, czy maszyny 
mogą myśleć. Turing stwierdza jednak, że jest ono „[...] zbyt wieloznaczne, 
aby w ogóle zasługiwało na dyskusję” [Turing 1950, s. 422]. Dlatego właśnie 
pragnie on zastąpić to pytanie innymi mianowicie, czy maszyna może 
odnieść sukces w zaprojektowanej przez niego grze. 

Zadajmy teraz pytanie „co stanie się, kiedy maszyna weźmie udział w tej grze”? Czy 
pytający dokona nietrafnej identyfikacji równie często, jak w przypadku, gdy w grze 
biorą udział kobieta i mężczyzna? [Turing 1950, s. 434], 

Zdaniem Turinga, tak zaprojektowany test ma wyrównać szanse człowieka 
i maszyny, rozdzielając cielesność od zdolności intelektualnych. To, czego po¬ 
winniśmy szukać, to analogie funkcjonalne między maszyną a człowiekiem. 

Już w „Computing Machinery...” Turing wspomina o wersji TT, w którym 
bierze udział tylko dwóch uczestników i określa ją mianem viva voce. W okre¬ 
sie po ukazaniu się „Computing Machinery...” Turing mówi o TT tylko w kon¬ 
tekście tego typu gry. Wydaje się, że oddaje to podstawową intuicję związaną 
z TT — wystarczy, że sędzia (pytający) oceniał będzie jedynie odpowie¬ 
dzi udzielane przez (potencjalny) komputer. Możemy więc pominąć trzeciego 
uczestnika gry bez szkody dla całej konstrukcji testu. W swoim artykule do¬ 
tyczącym testu Turinga A.P. Saygin, I. Cicekli i V. Akman poświęcają sporo 
miejsca na dyskusję dotyczącą roli trzeciej osoby w TT (por. [Saygin et al. 
2001]). Tymczasem sam Turing — w późniejszym okresie — wydaje się zu¬ 
pełnie ją ignorować, kładąc nacisk na inny aspekt gry w naśladownictwo. 
Robert Harnish w Minds, Brains, Computers. An Historical Introduction to 
the Foundations of Cognitme Science rozróżnia nawet grę, w której bierze 
udział trzech graczy od gry w wersji viva voce. Pierwszą z nich określa mia¬ 
nem „gry w naśladownictwo”, zaś tylko tę drugą nazywa testem Turinga (por. 
[Harnish 2002, s. 183]). 

W „Computing Machinery...” A.M. Turing w następujący sposób pisze 
o teście, w którym bierze udział dwóch graczy: 

Gra [w której pominięty został gracz B] jest często stosowana w praktyce pod nazwą 
viva voce aby odkryć, czy ktoś coś naprawdę zrozumiał, czy też tylko „wykuł to na 
blachę” [Turing 1950, s. 446]. 

Zaś w „Can Digital Computer Think”: 

Myślę, że prawdopodobne jest na przykład to, że z końcem tego stulecia będziemy 
potrafili programować maszyny, aby odpowiadały na pytania w taki sposób, że będzie 
niesłychanie trudno zgadnąć, czy odpowiedzi udzielane są przez człowieka, czy przez 
maszynę. Wyobrażam sobie coś na kształt sprawdzania typu viva voce , ale z pytaniami 
i odpowiedziami, które są przesyłane w formie maszynopisu [...] [Turing 1951a, s. 4—5]. 

Przyjęcie tej wersji testu pozwala uprościć analizę bez utraty głównych 
intuicji związanych z TT sformułowanym dla trzech uczestników. Dlatego 
założenia testu wyszczególniane poniżej będą dotyczyły wersji viva voce: 


1.2. Rekonstrukcja oryginalnych założeń testu Turinga 
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1. W grze uczestniczy dwóch graczy: C (pytający, sędzia) oraz A (podda¬ 
wany testowi). 

2. Gracze nie mogą się widzieć, słyszeć, pisać do siebie pismem odręcznym. 

3. To gracz C zadaje pytania, zaś gracz A na nie odpowiada. 

4. Celem gracza poddawanego testowi jest wprowadzenie w błąd gracza sę¬ 
dziego tak, aby uniemożliwić mu trafną identyfikację (por. [Turing 1950, 
s. 434]). Gracz A zobowiązany jest również do postępowania zgodnie ze 
strategią mówiącą, że ma jak najlepiej naśladować odpowiedzi, jakich 
udzieliłby człowiek na jego miejscu. Zdaniem Turinga jest to najlepsza 
z możliwych do przyjęcia strategii, o czym świadczy poniższy fragment 
zaczerpnięty z „Computing Machinery...”: 

Niektórzy mogą argumentować, że najlepszą strategią dla maszyny podczas „gry w na¬ 
śladownictwo” mogłoby być coś innego niż naśladowanie zachowania człowieka. Być 
może tak jest, ale uważam, że jest mało prawdopodobne aby tego typu działania przy¬ 
niosły jakiś znaczący efekt [...] Zakładam, że najlepszą strategią w tej sytuacji jest 
udzielanie odpowiedzi takich, jakie w naturalny sposób udzielone zostałyby przez czło¬ 
wieka [Turing 1950, s. 435]; wyróżnienie P.Ł. 

Gracz A zgodnie z tą strategią może używać pewnych „trików”: opóźniać 
nieco swoją odpowiedź (kiedy pytanie dotyczy np. zadania arytmetycznego), 
popełniać błędy w pisowni i błędy ortograficzne etc. O takiej możliwości 
wspomina Turing w „Can automatic calculating machines be said to think?”: 

[...] maszyna będzie mogła stosować wszystkie rodzaje sztuczek, tak aby jawić się w bar¬ 
dziej ludzki sposób, takie jak czekanie zanim poda odpowiedź, czy popełnianie błędów 
ortograficznych [...] [Newman et al. 1952, s. 5[. 

A także w „Intelligent Machinery, a Heretical Theory”: 

Jestem przekonany, że można skonstruować takie maszyny, które będą bardzo dokładnie 
symulowały działanie ludzkiego umysłu. Od czasu do czasu będą popełniały błędy i od 
czasu do czasu będą w stanie produkować nowe i interesujące stwierdzenia [...] [Turing 
19516, s. 2\. 

Odnośnie do pytań, które mogą pojawić się w ramach TT, Turing zdaje się 
nie wprowadzać szczególnych ograniczeń. Świadczą o tym poniższe fragmenty 
zaczerpnięte z „Computing Machinery...” oraz „Can automatic calculating ma¬ 
chines be said to think?”: 

Metoda pytań i odpowiedzi wydaje się być odpowiednia dla wprowadzenia niemal każdej 
z dziedzin ludzkiej aktywności, jaką chcielibyśmy rozważać [Turing 1950, s. 435]. 

[Braithwaite:] Czy pytania musiałyby być działaniami do wykonania, czy też mógłbym 
zapytać co komputer zjadł na śniadanie? 

[Turing:] Tak, cokolwiek. [...] „Przecież ty tylko udajesz, że jesteś człowiekiem” byłoby 
zupełnie na miejscu [Newman et al. 1952, s. 5[. 

W „Computing Machinery...” Turing podaje dwa przykłady możliwego dia¬ 
logu w sytuacji testu Turinga. Pierwszy z nich ma być ilustracją tego, że 
metoda pytań i odpowiedzi doskonale nadaje się do poruszenia niemal każdej 
dziedziny aktywności człowieka [Turing 1950, s. 434-435]: 
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1. Test Turinga 


C: Napisz mi proszę sonet na temat Forth Bridge. 

A: Nie licz na mnie w tei sprawie. Nie jestem zbyt dobry w pisaniu poezji. 

C: Dodaj 32957 i 70764 

A: (Pauza około 30 sekund a później odpowiada) 105621 

C: Czy grasz w szachy? 

A: Tak. 

C: Mam króla na e8 i nie mam innych figur. Ty masz tylko króla na e6 
i wieżę na hl. Twój ruch. Jak zagrasz? 

A: (Po piętnastominutowej przerwie) wieża na h8. Mat. 

Drugi z przykładów dialogu to „wzorcowa” gra viva voce [Turing 1950, s. 446]: 

C: Czy w pierwszym wierszu twojego sonetu, który brzmi „Czyż powinie¬ 
nem porównać cię do letniego dnia” sformułowanie „wiosenny dzień” nie 
byłoby równie dobre, czy może nawet bardziej odpowiednie? 

A: Nie, to nie pasuje. 

C: A co myślisz o „zimowym dniu”. To pasowałoby tutaj całkiem dobrze. 

A: Tak, ale nikt nie chce, żeby porównywać go z zimowym dniem. 

C: Czy przyznałbyś, że pan Pickwick przywodzi ci na myśl święta Bożego 
Narodzenia? 

A: Tak, przynajmniej w pewnym sensie. 

C: Boże Narodzenie to zimowy dzień i nie sądzę, żeby pan Pickiwck miał 
coś przeciwko porównaniu, o którym rozmawiamy. 

A: Myślę, że w tym momencie nie mówisz poważnie. Mówiąc o zimowym 
dniu mamy raczej na myśli typowy zimowy dzień, nie zaś tak wyjątkowy 
zimowy dzień, jakim są święta Bożego Narodzenia. 

Na podstawie przytoczonych cytatów przyjmuję tutaj, że sędzia może for¬ 
mułować trzy rodzaje wypowiedzi: (i) pytania; (ii) zdania eksplikujące pro¬ 
blem (powiązane z późniejszym pytaniem); (iii) zdania wyrażające opinie na 
temat udzielanych przez A odpowiedzi (przebiegu testu). 

Szczególnie istotna z perspektywy tej pracy jest pewna propozycja doty¬ 
cząca pytań, którą Turing wysunął w „Computing Machinery...”. Jego zda¬ 
niem powinniśmy również rozważyć sytuację TT, w którym sędzia zadaje 
jedynie pytania rozstrzygnięcia. Turing pisze: 

Oczywiście zakładamy, na chwilę obecną, że mamy do czynienia raczej z pytaniami, 
na które adekwatną odpowiedzią jest „Tak” lub „Nie”, niż pytaniami typu „Co sądzisz 
o Picassie?” [Turing 1950, s. 445]. 

Postulat taki miał zapewne źródło w niedoskonałości ówczesnych maszyn, 
ale można z niego wnioskować, że test mimo tego ograniczenia nadal speł¬ 
niałby swoje funkcje. Wydaje się, że Turing — zdając sobie sprawę z wymagań 
stawianych przez TT — myślał o pewnego rodzaju ewolucji: najpierw ma¬ 
szyny byłyby w stanie podchodzić do TT, w którym miałyby do czynienia 
jedynie z pytaniami rozstrzygnięcia, dopiero w dalszej perspektywie pytania 
stawiane przez sędziego mogłyby być pytaniami bardziej wyrafinowanymi. 
Za współczesną realizację tej propozycji moglibyśmy uznać MIST (Minimum 
Intelligent Signal Test) autorstwa Chrisa McKinstry (por. [McKinstry 1997], 
[McKinstry 2009] oraz rozdział 4.1.3). 
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Warto również zaznaczyć, że TT pomyślany jest jako test o charakterze 
statystycznym i — zdaniem Turinga — powinien być on powtarzany kil¬ 
kakrotnie dla uzyskania bardziej wiarygodnych wyników. Świadczą o tym 
przytoczone poniżej fragmenty. 

Główną ideą testu jest to, że maszyna — odpowiadając na zadawane jej pytania — 
ma udawać, że jest człowiekiem i zda ów test tylko wtedy, kiedy owo udawanie będzie 
przekonujące [...] Lepiej będzie jeśli założymy, że każdy z sędziów będzie musiał oceniać 
kilkakrotnie oraz, że czasami sędziowie będą mieli do czynienia rzeczywiście z człowie¬ 
kiem a nie z maszyną. Zapobiegnie to temu, żeby za każdym razem stwierdzali oni bez 
zastanowienia „to jest maszyna” [Newman et al. 1952, s. 5]. 

Jestem przekonany, że za około pięćdziesiąt lat możliwe stanie się takie programowanie 
komputerów z pojemnością pamięci rzędu 10 9 , aby radziły sobie w grze w naśladownic¬ 
two tak dobrze, że przeciętny pytający nie będzie miał więcej niż 70 procent szans na 
dokonanie prawidłowej identyfikacji po pięciu minutach stawiania pytań [Turing 1950, 
s. 442], 

Zagadnieniem o dużym znaczeniu dla konstrukcji TT jest również dobór 
sędziego. Ned Błock w artykule „The Mind as the Software of the Brain” 
przekonuje, że pomysł testu jest chybiony właśnie z powodu niedoprecyzo- 
wania tego, w jaki sposób powinna być wybierana osoba pytająca. Zauważa 
on w szczególności, że „[...] ekspert [w dziedzinie komputerów - przyp. P.Ł.] 
może wiedzieć, że obecne inteligentne maszyny radzą sobie z pewnymi pro¬ 
blemami kłopotliwymi dla ludzi” [Błock 1995 b, s. 379], dzięki czemu uzyska 
ogromną przewagę nad maszyną w teście Turinga. Turing zdawał sobie jed¬ 
nak sprawę z tej trudności. W „Computing Machinery...” pytający określany 
jest jako: „przeciętny pytający” (average interrogator) [Turing 1950, s. 442]; 
zaś w wywiadzie dla BBC jako osoba, która „[...] nie powinna być ekspertem 
w dziedzinie komputerów [...]” [Newman et al. 1952, s. 4[. Do dyskusji o roli 
doboru sędziego w teście Turinga powrócimy w rozdziale trzecim. 

Podsumowując, na test Turinga możemy patrzeć jako na system pytań 
i odpowiedzi. Wydaje się, że przy konstruowaniu jego modelu możemy potrak¬ 
tować test Turinga jako pewną procedurę badawczą, przeprowadzaną przez 
gracza C , której celem jest ustalenie wiarygodności deklaracji gracza A, iż jest 
on człowiekiem. Aby przeprowadzić weryfikację tej deklaracji, sędzia spraw¬ 
dza, jak gracz poddawany testowi „radzi sobie” w dziedzinach uznawanych za 
przejawy ludzkiej inteligencji. Test składa się więc z pewnych części - na¬ 
zwijmy je rundami — z których każda dotyczy pewnego zakresu przejawów 
inteligencji. Dla każdej rundy sędzia formułuje problem, charakterystyczny 
dla określonego przejawu ludzkiej inteligencji. 

Wyszczególnione powyżej założenia dotyczące testu Turinga (ich zesta¬ 
wienie zawiera tabela 1.1) rodzą kilka pytań i problemów. W szczególności 
intuicja dotycząca problemu doboru sędziego wyrażona przez przez N. Błocka 
wydaje się w tym kontekście bardzo interesująca. Wynik testu Turinga w du¬ 
żej mierze będzie zależał od przekonań i poglądów sędziego — w skrajnej 
sytuacji może nawet zdarzyć się tak, że jeden z sędziów orzeknie o graczu 
A , że jest on maszyną, zaś inny sędzia (o tym samym graczu A), iż jest on 
człowiekiem. 

Kolejnym ciekawym zagadnieniem jest adekwatność odpowiedzi udziela¬ 
nych przez gracza poddawanego testowi. Po pierwsze, musimy zadecydować, 
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Tablica 1.1. Zestawienie oryginalnych założeń testu Turinga opisanych w rozdziale 1 


Sytuacja testowa 

- W grze bierze udział 2 graczy (sędzia i poddawany testowi). 

- Gracze nie mogą się widzieć ani słyszeć. 

Przebieg testu 

- Test ma charakter statystyczny. 

- Powinien być powtarzany kilkakrotnie. 

- Nie powinno być tak, że przy każdym powtórzeniu poddawany 
testowi jest maszyną. 

- TT kończy dokonana przez sędziego identyfikacja: „A jest maszy¬ 
ną”, „A jest człowiekiem”. 

Sędzia 

- Nie powinien być ekspertem w sprawie komputerów. 

- Może formułować trzy rodzaje wypowiedzi: 
pytania; 

zdania eksplikujące problem (powiązane z późniejszym pytaniem); 
zdania wyrażające opinie na temat udzielanych przez A odpowiedzi 
(przebiegu testu). 

Pytania 

- To sędzia zadaje pytania, a poddawany testowi na nie odpowiada. 

- W pierwszej kolejności lepiej jest rozważać TT z pytaniami roz¬ 
strzygnięcia. 

- Docelowo w TT powinny być dozwolone pytania bardziej wyrafino¬ 
wane (dotyczące każdej ze sfer ludzkiej aktywności). 

Odpowiedzi 

- Poddawany testowi ma jak najlepiej naśladować odpowiedzi udzie¬ 
lane przez człowieka. 

- Może używać „trików”: opóźniać odpowiedź (np. gdy jest to zada¬ 
nie arytmetyczne), popełniać błędy itp. 


kiedy reakcja gracza A na zadane pytanie może zostać uznana za odpowiedź 
na owe pytanie. Ponadto pozostaje jeszcze problem zalecenia Turinga, że 
odpowiedzi udzielane przez maszynę mają być takie, „jakich udzieliłby czło¬ 
wiek” w rozważanej sytuacji — musimy ustalić kryterium, które pozwoli na 
zdecydowanie, czy dana odpowiedź jest taka, jakiej udzieliłby człowiek. 

W związku z postulatem o statystycznym charakterze testu również 
powstaje wiele ciekawych pytań. Ile razy należy przeprowadzać test dla jed¬ 
nego gracza? Jaki powinien być stosunek trafnych i nietrafnych identyfikacji 
(ewentualnie ile powinno być trafnych), żeby można było powiedzieć, że gracz 
A zdał TT? Ile powinien trwać jeden test? To tylko niektóre z nich. 

W dużej mierze rozważania przedstawione w dalszej części tej książki 
stanowią próbę zmierzenia się właśnie z wymienionymi tutaj problemami. 


1.3. Co bada test Turinga? 


Dla Turinga zastąpienie pytania „czy maszyny mogą myśleć?” pytaniem 
o powodzenie maszyn w pewnej zaprojektowanej przez niego grze nie miało 
być kluczem do rozstrzygnięcia problemu bycia istotą inteligentną w ogóle. 
W wywiadzie dla BBC z 1952 roku Turing, po krótkim omówieniu propozycji 
testu, powiedział: 
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A więc tak przedstawia się mój test. Oczywiście, na chwilę obecną, nie twierdzę ani że 
maszyny rzeczywiście mogą go zdać, ani że nie. Moja sugestia dotyczy raczej tego, że 
jest to właśnie pytanie, o którym warto dyskutować. Nie jest ono identyczne z pytaniem 
„Czy maszyny myślą”, ale — zważywszy na nasz cel — wydaje się ono wystarczająco 
do niego zbliżone [Newman et al. 1952, s. 5—6]; wyróżnienia P.Ł. 

Test Turinga nie ma zatem spełniać roli definicji własności bycia istotą 
inteligentną. Co do tego zgadza się większość badaczy testu Turinga. W lite¬ 
raturze dotyczącej TT znajdujemy natomiast szeroko zakrojoną dyskusję do¬ 
tyczącą tego, czy test Turinga możemy potraktować jako implikujący opera¬ 
cyjną (a więc cząstkową) definicję posiadania inteligencji. Argumenty na rzecz 
takiej interpretacji TT przedstawiają m.in. N. Błock [Błock 1995a, s. 248], 
R. French [Frencli 2000, s. 115] [Frencli 1990, s. 53], A. Hodges [Hodges 1992, 
s. 415], P.H. Millar [Millar 1973, s. 595] czy J. Searle [Searle 1980, s. 423]. 
Polemikę z takim stanowiskiem znajdziemy np. w [Copeland 2000], [Moor 
1976], 

Część autorów (m.in. N. Błock i J. Searle), uznając, że TT ma służyć 
operacyjnej definicji posiadania inteligencji przez maszyny, na tej podstawie 
krytykuje go za skrajnie behawiorystyczny charakter takiej definicji. Wydaje 
się jednak, że warto pokusić się na spojrzenie na to zagadnienie z nieco innej 
perspektywy, która — naszym zdaniem — znacznie lepiej pasuje do intencji 
samego Turinga. Perspektywą tą jest (klasyczne już na gruncie psychologii) 
rozróżnienie na inteligencję A, B i C wprowadzone przez D. O. Hebba w 1949 
roku (por. [Strelau 1987], [Nęcka 2005]). Pod pojęciem inteligencji A rozumie 
się wrodzone możliwości; zaś pod pojęciem inteligencji B, możliwości rzeczy¬ 
wiście rozwinięte. Natomiast inteligencja C „ogranicza się do zachowań, które 
ujawniają się w badaniach na podstawie testów inteligencji” [Strelau 1987, 
s. 17]. Tak rozumiane pojęcie inteligencji C ma charakter operacjonalistyczny. 
Nie sprawia to jednak, że jest ona postrzegana jako mniej wartościowa 
stanowi integralną część badań nad inteligencją człowieka. E. Nęcka w nastę¬ 
pujący sposób opisuje wzajemne relacje pomiędzy inteligencją A, B i C: 

Tylko część wrodzonych możliwości (inteligencja A) rozwija się w postaci inteligencji 
B, pozostała część rzeczywistych uzdolnień (inteligencja B) wynika z wiedzy i doświad¬ 
czenia, a nie w wrodzonych zadatków. Inteligencja B jest tyko w części wykrywana za 
pomocą testów, ujawniając się jako inteligencja C. Natomiast pewna część wariancji 
wyników testowych (inteligencji C) nie zależy ani od A, ani od B, a na przykład od 
lęku przed oceną lub nieumiejętności zdawania testów [Nęcka 2005, s. 22]. 

Wydaje się, że do takiego spojrzenia na zagadnienie badania inteligencji 
pasują intencje Turinga. We wspomnianym wywiadzie dla BBC na pytanie 
o to, czy dysponuje jakąś definicją bycia istotą inteligentną stwierdza on bo¬ 
wiem: 

Nie chcę podawać definicji myślenia , ale jeśli bym musiał, to prawdopodobnie nie był¬ 
bym w stanie powiedzieć nic ponad to, że jest to coś w rodzaju brzęczenia ( buzzing ), 
które zachodzi w mojej głowie. Nie sądzę jednak abyśmy musieli w ogóle zgadzać się 
co do jakiejkolwiek definicji. Najważniejszą sprawą jest aby spróbować wytyczyć linię 
oddzielającą właściwości mózgu człowieka, o których chcemy dyskutować od tych, które 
nas nie interesują. [...] Chciałbym zaproponować pewien test, który można by zasto¬ 
sować do maszyn. Można by nazwać go testem sprawdzającym, czy maszyna myśli. 
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Ale lepiej byłoby uniknąć niepotrzebnych dyskusji i powiedzieć, że maszyny, które po¬ 
myślnie przechodzą ów test są (powiedzmy) maszynami Klasy A [Newman et al. 1952, 
s. 3—4]; wyróżnienia P.Ł. 

W tym kontekście ciekawe wydaje się pytanie o to, jakiego rodzaju świadec¬ 
twa/uzasadnienia dla tezy o posiadaniu przez maszyny inteligencji dostarcza 
sukces odniesiony przez maszynę w teście Turinga. Najbardziej interesujące 
będą dla nas propozycje Jamesa Moora i Douglasa Stalkera. Pierwszy z nich 
przekonuje, że uzasadnienie to ma charakter indukcyjny (por. [Moor 1976, 
1978, 2001], por. też [Watt 1996]). 

Jestem przekonany, że tym, co jest istotne w teście Turinga, jest fakt, że dostarcza 
on dobrego wzorca dla gromadzenia indukcyjnych uzasadnień. Dzięki temu, gdyby test 
Turinga został zdany, mielibyśmy adekwatne podstawy dla indukcyjnego rozumowania 
prowadzącego do wniosku, że komputer może myśleć na poziomie normalnego dorosłego 
człowieka [Moor 1976, s. 299-300]. 

Punktem wyjścia dla Moora jest zadanie pytania o to, w jaki sposób my, 
jako ludzie, nabywamy przekonania o tym, że inni ludzie myślą. Jego zda¬ 
niem takie przekonanie jest częścią większej teorii, którą budujemy w celu 
wyjaśnienia zachowań innych. Oczywiście procesy myślowe są bardzo złożone 
i można je rozpatrywać w wielu aspektach, ale niezaprzeczalnym faktem jest 
to, że nie mamy bezpośredniego dostępu do cudzych stanów mentalnych. Je¬ 
dyne do czego mamy dostęp, to szeroko rozumiane zachowania innych ludzi. 
Na ich podstawie indukcyjnie wyprowadzamy wspomnianą teorię. Obserwa¬ 
cja zachowań innych pozwala nam na potwierdzanie, negowanie i modyfi¬ 
kacje wyprowadzonej przez nas teorii. W takiej sytuacji „nie ma wyraźnego 
powodu, dla którego wiedza o myśleniu komputerów nie miałaby powstawać 
w taki sam sposób’' [Moor 1976, s. 299]. 

Na pierwszy rzut oka propozycja Moora wydaje się bardzo intuicyjna 
i przekonująca. D.F. Stalker zauważa jednak pewną jej słabość: 

Zgodnie z tym [tzn. Moora — przyp. P.Ł.| podejściem nasze przekonania co do sfery 
mentalnej innych osób są częścią pewnej teorii wyjaśniającej. W celu wyjaśnienia za¬ 
chowań innych ludzi powołujemy się na teorię, która wymaga użycia pojęcia myślenia. 
Ale to nie daje nam pełnego obrazu. Nie mówi nam dlaczego powinniśmy przyjmować, 
że zachowania innych osób stanowią świadectwo posiadania przez nie jakiegoś rodzaju 
życia umysłowego [Stalker 1976, s. 308]; wyróżnienie P.Ł. 

Zdaniem Stalkera, przyjmujemy taką a nie inną teorię przypisywania in¬ 
nym stanów mentalnych, ponieważ jest ona najlepszą posiadaną przez nas 
teorią. Przy jej wyborze posługujemy się więc nie tyle indukcją, ile rozumo¬ 
waniem przypominającym rozumowanie abdukcyjne. 

Schemat rozumowania abdukcyjnego możemy przedstawić, za Peircem, 
w sposób następujący (por. [Peirce 1931/1958]): 

Obserwujemy zaskakujące zjawisko P. 

Gdyby Q było prawdziwe, zachodzenie P byłoby oczywistością. 

Mamy zatem podstawy, by podejrzewać, że Q jest prawdziwe. 

Warto wspomnieć, że istnieją dwie interpretacje rozumowań abdukcyjnych 
(por. [Urbański 2005, s. 146]). Wedle jednej z nich abdukcja służy jedynie ge¬ 
nerowaniu zbiorów hipotez wyjaśniających. Wedle drugiej interpretacji służy 
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nie tylko generowaniu, ale również ocenie tych hipotez wyjaśniających. Stal- 
ker wydaje się właśnie zwolennikiem tej drugiej interpretacji. 

Wyboru teorii wyjaśniającej zachowania maszyn dokonujemy podobnie, 
jak wyboru teorii pozwalającej nam wyjaśniać zachowania innych ludzi. Jeśli 
przyjmiemy, że w powyższych schematach P oznaczać będzie zdanie TT, zaś 
Q bycie inteligentnym, to z tego, że maszyna zdaje TT razem z poglądem, 
że inteligencja (a przynajmniej jakiś jej rodzaj) implikuje zdolność do zdania 
TT wnioskujemy, że poddawana testowi maszyna posiada inteligencję (por. 
[Shieber 2007]). 

A zdaje test Turinga. 

Jeżeli A jest inteligentny, to A zdaje test Turinga. 

Mamy zatem podstawy, by podejrzewać, że A posiada inteligencję. 

Uznanie, że sukces odniesiony w teście Turinga dostarcza jedynie abduk- 
cyjnego uzasadnienia dla tezy o posiadaniu inteligencji przez maszyny może 
być postrzegane jako zbytnie osłabienie propozycji Turinga. Wydaje się jed¬ 
nak, że takie ujęcie problemu uzasadniania dostarczanego przez TT bardzo 
dobrze odpowiada — opisanej powyżej — procedurze przyjmowanej przez 
Turinga przy konstruowaniu jego propozycji, tj. zastąpieniu pytania „czy ma¬ 
szyna może myśleć?” pytaniem o powodzenie maszyny w przeformułowanej 
grze w naśladownictwo. 


1.4. Pewne nieporozumienia wokół testu Turinga 

W literaturze przedmiotu można znaleźć pewne dyskusje wokół TT, które 
wydają się mieć źródło w niezrozumieniu istoty propozycji Turinga. Omówię 
tutaj trzy z nich: dyskusję poświęconą przewidywaniom Turinga co do czasu 
powstania maszyn myślących; próby traktowania testu Turinga jako testu 
płci; a także zarzuty dotyczące antropocentryzmu testu Turinga. 


1.4.1. Prognoza Turinga 


Turing w „Computing Machinery...” zawarł, cytowaną już wyżej, następu¬ 
jącą prognozę dotyczącą możliwości powstania maszyn zdolnych do zdania 
testu Turinga: 

Jestem przekonany, że za około pięćdziesiąt lat możliwe stanie się takie programowanie 
komputerów z pojemnością pamięci rzędu 10 9 , aby radziły sobie w grze w naśladownic¬ 
two tak dobrze, że przeciętny pytający nie będzie miał więcej niż 70 procent szans na 
dokonanie prawidłowej identyfikacji po pięciu minutach pytania [Turing 1950, s. 442]. 

Wielu autorów, powołując się na powyższy fragment „Computing Machi¬ 
nery...”, krytykuje Turinga za zbytni optymizm, a nawet wyprowadza z tej 
wypowiedzi argument przeciwko testowi Turinga, traktując przedstawione 
w niej przewidywania jako coś, co do czego Turing był całkowicie przeko- 
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nany (por. [Purtill 1971], [Sampson 1973], [Whitby 1996], [Whitby 1997], 
[Saygin et al. 2001]). G. Sampson pisze po prostu: 

Turing zaproponował „grę w naśladownictwo” jako kryterium pozwalające zdecydować, 
czy komputer może myśleć i przewidział, że do roku 2000 niektóre komputery pomyślnie 
przejdą zaproponowany test [Sampson 1973, s. 173]; wyróżnienie P.Ł. 

Inny badacz zajmujący się testem Turinga — R. Purtill — zdecydowanie 
krytykuje Turinga za przewidywania dotyczące maszyn pomyśnie przecho¬ 
dzących test. W „Beating the Imitation Gamę” pisze: 

[...] przewidywanie Turinga dotyczące tego, że komputery, które mogłyby zagrać w grę 
w naśladownictwo zbudowane zostaną w przeciągu pięćdziesięciu lat od ukazania się 
jego artykułu (to znaczy w roku 2000) było w oczywisty sposób dużą przesadą [Purtill 
1971, s. 169]; wyróżnienie P.Ł. 

Tymczasem, jak słusznie zauważają zarówno S. Shieber [Shieber 2004, 
s. 98], jak i B. J. Copeland [Copeland 2000, s. 527] jest to tylko jedno z prze¬ 
widywań Turinga odnośnie do tej sprawy i na pewno nie należy traktować 
tej jego wypowiedzi jako swego rodzaju prognozy, która — niespełniona 
może służyć za podstawę krytyki testu Turinga. 

W przytoczonym wcześniej fragmencie „Can digital computers think?” 
Turing podkreśla, że wszelkie tego typu prognozy są jedynie jego przypusz¬ 
czeniami: 

Myślę, że prawdopodobne jest na przykład to, że z końcem tego stulecia będziemy 
potrafili programować maszyny, aby odpowiadały na pytania w taki sposób, że będzie 
niesłychanie trudno zgadnąć czy odpowiedzi udzielane są przez człowieka, czy przez 
maszynę. [...] Przedstawiam tu jedynie moje zdanie w tej sprawie; jest jeszcze wiele do 
powiedzenia dla innych [Turing 1951a, s. 4-5]; wyróżnienie P.Ł. 

W wywiadzie dla BBC z 1952 roku znajdujemy już znacznie bardziej 
ostrożną prognozę: 

[Newman:] Chciałbym być przy tym, kiedy zostanie rozegrany ów mecz między czło¬ 
wiekiem a maszyną i spróbować swoich sił w formułowaniu niektórych pytań. Zdaje się 
jednak, że jeżeli żadne z pytań nie będą zabronione, minie sporo czasu zanim maszyny 
będą miały choć cień szansy. 

[Turing:] O tak, powiedziałbym, że przynajmniej 100 lat [Newman et al. 1952, s. 6[. 

Należy pamiętać, że podane fragmenty wypowiedzi Turinga stanowią jedy¬ 
nie jego przypuszczenia (co wydaje się zupełnie zrozumiałe, jeśli weźmiemy 
pod uwagę to, że w momencie ich formułowania nie istniały jeszcze kompu¬ 
tery w dzisiejszym tego słowa znaczeniu). Wykorzystywanie tych prognoz do 
krytykowania idei testu Turinga wydaje się sporym nadużyciem. Istnieje wiele 
słabych punktów propozycji Turinga — zwłaszcza jeżeli chcemy ją odtworzyć 
jedynie na podstawie „Computing Machinery...” — i to nimi należałoby się 
raczej zająć. Dyskusja o tym czy Turing był, czy nie był zbytnim optymistą, 
czy jego „przepowiednia” sprawdziła się, czy nie, nie wnosi wartościowych 
wątków do dyskusji dotyczących adekwatności testu Turinga jako narzędzia 
rozpoznawania obecności inteligencji w sztucznych systemach poznawczych. 
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1.4.2. Test Turinga jako test płci 

Podobny charakter ma dyskusja dotycząca nieprawidłowego, zdaniem 
niektórych autorów, odczytania propozycji Turinga z „Computing Maclii- 
nery... ”. W celu usystematyzowania stanowisk w tej sprawie powstał nawet 
podział na standardowy sposób odczytywania tekstu Turinga oraz na sposób 
literalny. Sformułowanie tego podziału znajdujemy w artykule „Turing’s rules 
for the Imitation Gamę” autorstwa G. Piccininiego: 

Przy standardowym odczytaniu, test Turinga można skrótowo opisać jako porównanie 
ludzi i maszyn, w którym pytający wymaga od maszyny zademonstrowania odpowied¬ 
niej biegłości w posługiwaniu się ludzkim językiem, wiedzą oraz zdolnościami rozumo¬ 
wania. Opanowanie tych umiejętności [...] stanowi wyraźny znak inteligencji czy też 
myślenia [Piccinini 2000, s. 572]. 

Jeżeli zaś chodzi o zwolenników literalnego odczytywania „Computing Machi- 
nery...” (por. [Genova 1994], [Lassegue 1996], [Lassegue 2009], [Naur 1986], 
[Gelernter 1994], [Hayes, Ford 1995]), to: 

[...] sugerują, że celem maszyny jest symulowanie mężczyzny imitującego kobietę, pod¬ 
czas gdy pytający — nieświadomy rzeczywistego celu testu — nadal stara się określić, 
który z dwojga graczy jest kobietą, a który mężczyzną [Piccinini 2000, s. 572], 

Uzasadnienia szukają oni we fragmencie „Computing Machinery...”, w któ¬ 
rym Turing najpierw opisuje grę w naśladownictwo, po czym zastępuje jed¬ 
nego z graczy (mężczyznę) maszyną. Zadaniem komputera nie jest więc na¬ 
śladowanie człowieka jako takiego, ale raczej człowieka konkretnej płci. Jak 
pisze Judith Genova: 

[...] test zdolności maszyny do myślenia okazuje się nie dotyczyć tego, czy maszyna 
jest w stanie przekonać sędziego, który jest człowiekiem, że ona również nim jest, ale 
raczej tego, żeby zwieść gracza C, tak aby przekonany byl, że maszyna jest człowiekiem 
określonego rodzaju, tzn. raczej mężczyzną, niż kobietą [Genova 1994, s. 313—314], 

Argumentacja zwolenników literalnego odczytywania propozycji Turinga 
opiera się na założeniu, że takie, a nie inne sformułowanie odnośnego frag¬ 
mentu „Computing Machinery...” nie było w tym miejscu przypadkowe. Na 
uwagę zasługują tutaj teksty J. Genovy oraz J. Lassegue’a. Autorzy ci, opie¬ 
rając się na biografii Turinga starają się doszukać jej wpływu na treść „Com¬ 
puting Machinery...”. Dochodzą do wniosku, że dla Turinga inteligencja była 
w jakiś sposób zależna od płci (w obu tekstach znajdziemy np. twierdzenie, 
że Turing uważał kobiety za mniej inteligentne od mężczyzn). Z kolei zdaniem 
Susan Sterrett, naśladowanie płci przez maszynę w grze w naśladownictwo 
ma sprawić, że TT będzie trudniejszy i bardziej wiarygodny jako narzędzie 
badania maszynowej inteligencji (por. [Sterrett 2000]). 

Zarówno A. Hodges (por. [Hodges 1998]), jak i S. Shieber (por. [Shieber 
2004]) zwracają uwagę na to, że rzeczywiście modyfikacja wprowadzona do 
gry w imitację przez Turinga może być na pierwszy rzut oka myląca, ale 
dalsza lektura „Computing Machinery...” — zwłaszcza w momencie, gdy Tu¬ 
ring wprowadza grę typu viva voce — powinna usunąć wszelkie wątpliwo¬ 
ści. Literalne odczytanie tekstu „Computing Machinery...” jest również nie 
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do utrzymania w konfrontacji z przeprowadzoną powyżej rekonstrukcją TT 
w oparciu o inne teksty Turinga dotyczące proponowanego przez niego testu 
(por. rozdział 1.2). 


1.4.3. Antropomorfizm testu Turinga 


Zarzut o antropomorficznym charakterze testu Turinga pojawia się stosun¬ 
kowo często w literaturze przedmiotu (por. np. [Saygin et al. 2001, s. 467- 
468], [Copeland, Proudfoot 2009, s. 128-129], [Drozdek 1998], [Cullen 2009]). 
Jedno z lepiej znanych jego sformułowań znajdujemy w artykule R. Fren- 
cha „Subcogniton and the Limits of the Turing Test” [French 1990]. French 
podkreśla w nim, że test Turinga jest testem wyłącznie (i typowo) ludzkiej 
inteligencji, co czyni go nieciekawą propozycją narzędzia do rozpoznawania 
obecności inteligencji w sztucznych systemach poznawczych. 

Wydaje się, że krytyka testu Turinga, jako testu zorientowanego antropo- 
centrycznie, wynika z niezrozumienia idei propozycji Turinga. Jak ujmują to 
B. J. Copeland i D. Proudfoot: 

Zamierzeniem Turinga było dokładnie to, aby gra w naśladownictwo testowała, czy dana 
maszyna emuluje — lub nie — inteligentne zachowania ludzkiego mózgu 
[Copeland, Proudfoot 2009, s. 129]; wyróżnienie P.Ł. 

Na korzyść takiego stanowiska może przemawiać to, jaką strategię po¬ 
stępowania w teście zaleca Turing dla testowanej maszyny. W „Computing 
Machinery...” podkreśla on, że: 

Niektórzy mogą argumentować, że najlepszą strategią dla maszyny podczas „gry w na¬ 
śladownictwo” mogłoby być coś innego niż naśladowanie zachowania człowieka. Być 
może tak jest, ale uważam, że jest mało prawdopodobne aby tego typu działania przy¬ 
niosły jakiś znaczący efekt [...] [Turing 1950, s. 435]; wyróżnienie P.Ł. 


Dlatego właśnie postuluje ou, aby maszyna biorąca udział w teście imito¬ 
wała ludzkie zachowania, udzielając odpowiedzi takich „[...] jakie w naturalny 
sposób udzielone zostałyby przez człowieka” [Turing 1950, s. 435]. Cala idea 
testu Turinga opiera się na prostym w zasadzie pomyśle — zastąpmy pytanie 
„czy maszyny mogą myśleć?” takim pytaniem, co do którego istnieje choć cień 
szansy na udzielenie jednoznacznej odpowiedzi (a więc pytaniem o to, czy ma¬ 
szyna poradzi sobie w pewnego typu grze równie dobrze jak człowiek). Formu¬ 
łowanie zarzutu o antropomorficznym charakterze testu Turinga wydaje się 
w tym kontekście nietrafne. Próby „wzbogacenia” TT o rozmaite dodatkowe 
aspekty, które mógłby on badać stoją w sprzeczności z ideą zaprojektowania 
w miarę prostego narzędzia, które daje nadzieję na praktyczne wykorzystanie 
(por. choćby próby „utrudnienia” testu Turinga opisane w rozdziale drugim 
w kontraście z systemami CAPTCHA przedstawionymi w rozdziale czwartym 
niniejszej książki). 

Ciekawy glos w tej dyskusji zabiera również A. Drozdek w artykule „Hu¬ 
mań Intelligence and Turing Test”. Pisze on: 
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Komputery zostały skonstruowane i zaprogramowane przez ludzi; a zatem to ludzka in¬ 
teligencja została wykorzystana aby je stworzyć. Tym samym [...] możemy komunikować 
się z komputerami, ponieważ są one owocem ludzkiej inteligencji i ludzka inteligencja 
jest w nie niejako wbudowana. Komunikacja jest możliwa, ponieważ stworzyliśmy je 
do komunikowania się, ponieważ komputery zaprogramowane są właśnie do komuniko¬ 
wania się — a przynajmniej tak, aby sprawiały wrażenie, że się komunikują [Drozdek 
1998, s. 317]. 

Stanowisko takie wspierają wyniki badań, prowadzonych w celu bliższego 
zrozumienia interakcji ludzi z komputerami. W wynikach tych często uwi¬ 
dacznia się antropomorfizujący stosunek do komputerów (niektórzy bada¬ 
cze uważają nawet, że jest to domyślne nastawienie poznawcze ludzi w od¬ 
niesieniu do tych elementów środowiska, których nie jesteśmy w stanie w 
pełni kontrolować — por. [Caporael, Heyes 1996]). Okazuje się, że ludzie w 
trakcie interakcji z komputerem — czy może lepiej powiedzieć z programem 
komputerowym — wykazującym choćby elementarne umiejętności konwer- 
sacyjne, stosują reguły społeczne znane z interakcji z innymi ludźmi (por. 
m.in. [De Angeli et al. 1999], [Dryer 1999], [De Angeli, Lynch, Johnson 2001], 
[De Angeli, Graham, Johnson, Coventry 2001], [Gratch, Marsella 2005] oraz 
[van Vugt et al. 2007]). 


Rozdział 2 


Spory i dyskusje wokół testu Turinga 


2.1. Wprowadzenie 

U podłoża propozycji A. M. Turinga leżą bardzo silne intuicje dotyczące 
tego, w jaki sposób nabieramy przekonania o obecności stanów mentalnych 
u innych osób (por. rozdział 1.3). Atrakcyjna wydaje się również względna 
prostota dostarczanego przez test Turinga kryterium posiadania inteligen¬ 
cji przez maszyny (uwidacznia się ona szczególnie w kontekście propozycji 
uczynienia TT bardziej restrykcyjnym, omówionych w dalszej części tego 
rozdziału). Zgodność z pewnymi intuicjami nie może być jednak ostatecznym 
wyznacznikiem adekwatności propozycji rozwiązania problemu tak ważkiego, 
jak ten wyrażony pytaniem: czy maszyny mogą myśleć? Dlatego też wokół 
zagadnienia adekwatności testu Turinga, jako narzędzia służącego do rozpo¬ 
znawania obecności inteligencji w sztucznych systemach poznawczych (jak 
będę starał się pokazać poniżej, rozumianego przynajmniej dwojako), toczą 
się żywe dyskusje od momentu jego powstania aż po dzień dzisiejszy. 

Pierwszą grupę zarzutów wobec testu zamieszcza Turing już w „Compu- 
ting Machinery...” Są to: (1) sprzeciw teologiczny, (2) argument „głów schowa¬ 
nych w piasku”, (3) argument matematyczny, (4) argument ze świadomości, 
(5) argument z różnych niemożności, (6) zarzut lady Lovelace, (7) argument 
z ciągłości systemu nerwowego, (8) argument z nieformalności zachowania 
oraz (9) argument z percepcji pozazmysłowej. Większość z nich ma dziś zna¬ 
czenie jedynie historyczne, niemniej jednak zasługują one na choć krótkie 
omówienie. Niektóre z przedstawionych argumentów wydają się z dzisiejszej 
perspektywy nieaktualne bądź nawet dziwne (tak jak argument z percepcji 
pozazmysłowej). Część z nich jest jednak nadal obecna w literaturze przed¬ 
miotu lub powraca w niej w nieco zmienionej postaci (tak jest na przykład 
z zarzutem lady Lovelace oraz z zarzutem matematycznym). 

1. Obiekcję natury teologicznej (The Theological Objection ) rekonstruuje 
Turing w następujący sposób: „Myślenie jest funkcją ludzkiej nieśmier¬ 
telnej duszy. Bóg ofiarował duszę każdemu mężczyźnie i każdej kobiecie, 
ale nie obdarzył nią zwierząt ani maszyn. Dlatego też ani zwierzę, ani 
maszyna nie mogą myśleć” [Turing 1950, s. 443]. 
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Turing nie zgadza się z żadną częścią tego rozumowania, ale podejmuje 
próbę odpowiedzi w podobnym stylu: tak skonstruowany argument go¬ 
dzi we wszechmoc Bożą. Moglibyśmy sobie przecież wyobrazić, że Bóg 
decyduje się obdarować duszą słonia, a nawet ... maszynę. 

2. Argument „głów schowanych w piasku” ( The ‘Heads in the Sand’ Ob- 
jection ): „Konsekwencje myślenia maszyn będą zbyt nieprzewidywalne, 
miejmy więc nadzieję, że nie będą one tego robiły” [Turing 1950, s. 444]. 
Argument ten, zdaniem Turinga, nie wymaga odrzucenia czy obale¬ 
nia, ponieważ ma swoje podłoże w reakcji emocjonalnej. Spełnia on 
jednak ważną rolę, wskazując na pewne niebezpieczeństwa, jakie nie¬ 
sie ze sobą idea myślących maszyn. Nie powinien jednak prowadzić do 
skrajnych postaw, bowiem nieznajomość konsekwencji wynikających ze 
skonstruowania myślącej maszyny wcale nie pociąga za sobą odgórnej 
konieczności zrezygnowania z projektu skonstruowania sztucznej inte¬ 
ligencji. Argument „głów schowanych w piasku” pojawia się w litera¬ 
turze przedmiotu w dyskusjach poświęconych tzw. sztucznemu geniu¬ 
szowi (por. np. [Penrose 2000], [Penrose 1995], [Penrose 2001], [Lem 
1999], [Marciszewski 1995], [Łupkowski 20056]) oraz w szerzej zakrojo¬ 
nych rozważaniach dotyczących oceny postępu technologicznego (por. 
np. „Etyka technologii i technologia etyki” w [Lem 1984]; por. też [Jonas 
1996], [Kiepas 1992], [Putnam 1975], [Horgan 1999]). 

3. Argument matematyczny ( The Mathematical Objection). Istnieją wy¬ 
niki z dziedziny logiki matematycznej, które wskazują na pewne ogra¬ 
niczenia maszyn cyfrowych. Ze względu na te ograniczenia, maszyna 
biorąca udział w teście Turinga nie będzie w stanie odpowiedzieć na 
pewne pytania lub udzieli odpowiedzi, która jest błędna (a tym samym 
zdemaskuje siebie jako maszynę). 

Zdaniem Turinga, argument ten będzie groźny dla testu Turinga do¬ 
piero, gdy uda się wykazać, że podobne ograniczenia nie dotyczą ludz¬ 
kiego intelektu. Do argumentu matematycznego wrócimy w dalszej czę¬ 
ści niniejszego rozdziału, przedstawiając jego wersję sformułowaną za 
pomocą logiki pytań. 

4. Argument ze świadomości ( The Argument from Consciousness). Za¬ 
rzut ten można rozbić na dwie części. W pierwszej z nich mówi się, że 
maszyny cyfrowe nie będą mogły myśleć, ponieważ aby myśleć, trzeba 
wiedzieć , że się myśli, czyli posiadać pewną formę samoświadomości. 
W drugiej części twierdzi się, że myślenie nieodłącznie związane jest 
z okazywaniem całej gamy emocji, do czego nie byłyby zdolne maszyny 
cyfrowe. 

Turing zauważa, że pierwsza część argumentu może prowadzić do zajęcia 
stanowiska solipsystycznego. Odnośnie do drugiej części argumentu ze 
świadomości, Turing przytacza hipotetyczną rozmowę maszyny z czło¬ 
wiekiem, w której maszyna korzysta z programu na tyle zaawansowa¬ 
nego, że przechodzi test Turinga. Na podstawie tej rozmowy Turing 
stara się pokazać, że w odpowiedziach udzielanych przez dysponującą 
wystarczająco wyrafinowanym programem maszynę można odnaleźć 
przejawy rozmaitych emocji. 
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5. Argument z różnych niemożności {Arguments from Various Disabilities) 
opiera się na rozumowaniu następującym: „Gwarantuję ci, że pomimo 
tego, że jesteś w stanie zbudować maszyny o wszystkich wymienionych 
przez ciebie zdolnościach, to nigdy nie zbudujesz maszyny, która może 
zrobić X” [Turing 1950, s. 447], gdzie za X można podstawić np.: by¬ 
cie towarzyskim, posiadanie poczucia humoru, posiadanie ulubionych 
potraw itp. Zdaniem Turinga taka postawa może wynikać z niepełnej 
wiedzy o zasadach działania maszyn cyfrowych. Zgadza się on z tym, 
że współczesne mu maszyny rzeczywiście nie posiadają imponujących 
możliwości imitowania typowo ludzkich zachowań, ale zauważa jedno¬ 
cześnie, że wzrost możliwości obliczeniowych komputerów prawdopo¬ 
dobnie zlikwiduje ten problem. 

6. Zarzut lady Lovelace ( Lady Lovelace’s Objection): maszyna cyfrowa jest 
w stanie zrobić tylko to, co nakazuje jej program, nie ma tu miejsca na 
inwencję twórczą. Turing przyznaje, że maszyny są ograniczone progra¬ 
mami, zgodnie z którymi działają, ale równie dobrze można powiedzieć, 
że człowiek posiada podobne ograniczenia (wynikające z jego budowy, 
genów, wiedzy itp.). Jeżeli wyobrazimy sobie wystarczająco skompliko¬ 
wany program (uruchomiony na maszynie o odpowiednio dużych możli¬ 
wościach), to ograniczenia, jakim będzie on podlegał mogą być bardziej 
podobne do tych, którym podlega człowiek niż do tych, którym podle¬ 
gają proste programy. 

Zarzut lady Lovelace posłużył za inspirację do stworzenia tzw. testu 
lady Lovelace ( Lovelace Test), który zdaniem jego autorów lepiej nadaje 
się do rozpoznawania obecności inteligencji w sztucznych systemach po¬ 
znawczych niż test Turinga. Test lady Lovelace opisany jest szczegółowo 
w rozdziale 4.1.2. 

7. Argument z ciągłości układu nerwowego ( Argument from Continuity in 
the Nervous System ): układ nerwowy nie może być modelowany przez 
maszynę o stanach dyskretnych, ponieważ ma charakter analogowy. Tu¬ 
ring odpowiada jedynie, że w sytuacji testu Turinga różnica pomiędzy 
maszyną o stanach dyskretnych i maszyną analogową jest bez znaczenia 
— sędzia nie będzie w stanie w żaden sposób wykorzystać wiedzy o tej 
różnicy w celu dokonania trafnej identyfikacji gracza. 

8. Argument z nieformalności zachowania ( The Argument from Informa- 
lity of Behauiour). Argument ten opiera się na założeniu, że nie jesteśmy 
w stanie spisać wszystkich możliwych reguł zachowania dla wszystkich 
możliwych sytuacji, które mogłyby mieć miejsce. Turing zauważa, że ar¬ 
gument ten jest niejasny. Należałoby wyjaśnić, czy wspomniane reguły 
mówią, jak zachowa się człowiek w pewnej sytuacji, czy też jak powi¬ 
nien się zachować. Jeżeli rozważamy drugą z opcji, to nie ma żadnych 
podstaw, aby twierdzić, że maszyny byłyby tutaj w gorszej sytuacji niż 
ludzie. Nie jest bowiem możliwe sformułowanie kompletnego kodeksu 
oczekiwanych zachowań dla każdej możliwej sytuacji dotyczy to za¬ 
równo ludzi, jak i maszyn. 

Argument z nieformalności zachowania wpisuje się w szerszą dyskusję 
dotyczącą tzw. problemu ramy ( frame problem) w kontekście badań nad 
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sztuczną inteligencją, a także rozważań epistemologicznych 1 . Obszerne 
omówienie tego zagadnienia w odniesieniu do testu Turinga zawiera 
monografia autorstwa L. J. Crocketta The Turing Test and the Frame 
Problem. AI’s Mistaken Understanding of Intelligence [Crockett 1994]. 

9. Argument z percepcji pozazmyslowej ( Extra Sensory Perception). Zja¬ 
wiska zaliczane do dziedziny percepcji pozazmyslowej (takie jak: tele¬ 
patia, jasnowidzenie, psychokineza) nigdy nie będą dostępne maszynie 
cyfrowej, ponieważ wszystkie zdają się przeczyć temu, co moglibyśmy 
umieścić w ramach wyjaśnienia naukowego. Gdyby więc w teście Tu¬ 
ringa sędzią uczynić doskonałego telepatę, czy maszyna byłaby w stanie 
przejść ów test? 

Zdaniem Turinga jest to jak najbardziej możliwe — przecież jeżeli uzna¬ 
jemy możliwość pozazmyslowej percepcji, wszystko może się zdarzyć. 

W dalszej części niniejszego rozdziału poświęcę uwagę głównie bardziej 
współczesnym rozważaniom dotyczącym TT. Wydaje się, że dyskusje toczące 
się wokół zagadnienia adekwatności testu Turinga, jako narzędzia służącego 
badaniu obecności inteligencji w sztucznych systemach poznawczych, można 
podzielić na dwa nurty (różniące się od siebie kryterium przyjmowanym do 
oceny TT). W tym celu skorzystam z propozycji R. Frencha przedstawionej 
w artykule „Subcogniton and the Limits of the Turing Test” [French 1990]. 
French wyróżnia w nim dwie tezy TT: 

1. Tezę o teście Turinga ( the TT Claim ): gra opisywana przez Turinga 
stanowi dobry test do rozpoznawania obecności inteligencji. 

2. Tezę o maszynie myślącej ( the Thinking Machinę Claim): odpowiednio 
zaprogramowany komputer może zdać test Turinga. 

R. French nazywa je odpowiednio tezą filozoficzną i tezą pragmatyczną. 
Dyskusje skoncentrowane wokół tezy filozoficznej zmierzają raczej w kierunku 
wykazania potrzeby porzucenia TT. Wskazuje się tu na rolę behawioryzmu 
w teście oraz na jego funkcjonalistyczny charakter. Adekwatność TT jest 
więc postrzegana przez pryzmat definicji posiadania inteligencji, dostarcza¬ 
nej przez TT. W dyskusjach dotyczących tezy pragmatycznej możemy wy¬ 
różnić dwa skrajne stanowiska. Zwolennicy pierwszego z nich uważają, że 
test Turinga jest zbyt łatwy, podczas gdy zwolennicy drugiego utrzymują, że 
TT jest zbyt trudny, aby zdała go (nawet inteligentna) maszyna. Wskazuje 
się tutaj na pewne rozwiązania, dzięki którym TT stanie się bardziej wiary¬ 
godny, lepszy, możliwy do praktycznego zastosowania etc. Adekwatność testu 


1 Pojęcie problemu ramy (/ramę problem) pojawiło się po raz pierwszy w artykule 
Johna McCarthy’ego i P. Hayesa „Some Philosophical Problems from the Standpoint of 
Artificial Intelligence” [McCarthy, Hayes 1969]. Problem ramy możemy najogólniej rozu¬ 
mieć jako problem dotyczący tego, które z przekonań podmiotu poznającego powinny być 
uaktualniane (a które nie) w trakcie interakcji z otoczeniem. Problem ramy posiada za¬ 
sadniczo dwie wersje — formalną (na gruncie badań nad sztuczną inteligencją) oraz bar¬ 
dziej ogólną (sformułowaną na gruncie dociekań filozoficznych — w ramach epistemolo¬ 
gii). Omówienie genezy oraz ewolucji problemu ramy zainteresowany Czytelnik znajdzie 
m.in. w [Shanahan 2003], [Reiter 2001] oraz we wspomnianej w tekście pozycji autorstwa 
L. J. Crocketta [Crockett 1994], 
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wiąże się w tym przypadku z pragmatycznym aspektem odróżniania człowieka 
i maszyny w sytuacji TT. 


2.2. Filozoficzna teza testu Turinga 


Przedstawię teraz pewien typ argumentacji skierowanej przeciwko testowi 
Turinga, który można określić mianem argumentu z zupełnego systemu kon- 
wersacyjnego (por. [Łupkowski 2006]). Idea tego typu argumentacji sprowa¬ 
dza się do wykazania, że nawet jeśli maszyna zdałaby test Turinga, to i tak 
nie moglibyśmy powiedzieć o niej, że jest inteligenta, ponieważ TT dostarcza 
z gruntu błędnej definicji posiadania inteligencji przez maszyny. Jak ujmuje 
to N. Błock: 

[...] problem z testem Turinga rozpatrywanym z perspektywy teoretycznej jest taki, że 
duży nacisk kładzie się w nim raczej na zachowanie niż na kompetencję. Oczywiście 
zachowanie jest wskaźnikiem posiadania kompetencji, ale sedno naszego rozumienia 
umysłu leży w kompetencjach umysłowych, a nie obserwowalnym zachowaniu [Błock 
19956, s. 384], 

Jako najbardziej reprezentatywne sformułowania tego typu argumentacji 
wybrałem argument z drzewa konwersacji autorstwa N. Błocka (wraz z jego 
historycznie wcześniejszym ujęciem autorstwa S. Lema) oraz argument chiń¬ 
skiego pokoju przedstawiony przez J. Searle’a. 


2.2.1. Argument z drzewa konwersacji 

Dokładne sformułowanie argumentu Błocka znajduje się w artykule „The 
Mind as the Software of the Brain” [Błock 1995 b\. Dla uproszczenia, Błock 
nakłada górną granicę na czas trwania testu Turinga, która wynosi godzinę. 
Przy takim założeniu możliwe jest — zdaniem Błocka — spisanie drzewa kon¬ 
wersacji, zawierającego wszystkie możliwe jej warianty, które mogłyby wystą¬ 
pić w ciągu jednej godziny. Błock zakłada również, że mogłaby istnieć ma¬ 
szyna, której możliwości pamięciowe pozwoliłyby na przechowywanie takiej 
struktury. Jak miałoby powstać wspomniane drzewo wypowiedzi? W pierw¬ 
szym kroku programiści powinni spisać wszystkie, dające się zapisać, ciągi 
znaków (przy czym powinny to być takie ciągi znaków, które dają się wyge¬ 
nerować w ciągu jednej godziny). Możemy oznaczyć je jako A 1; ..., A n . W ko¬ 
lejnym kroku programiści powinni wyszukać wszystkie możliwe i adekwatne 
reakcje werbalne dla każdego A i ułożyć je w listę (gdzie B i by¬ 

łoby odpowiedzią na A\). Następnie należałoby wybrać odpowiedzi na każde 
B i uporządkować je w listę oznaczoną literami C z odpowiednim indeksem. 
Procedura taka powinna być wykonywana aż do uzyskania wszystkich moż¬ 
liwych przebiegów konwersacji dla trwającego jedną godzinę testu Turinga. 
Ostatecznie więc uzyskujemy strukturę przedstawioną na rysunku 2.1. 
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-Al ••• A n 

Bi — B n 



Rysunek 2.1. Drzewo konwersacji [Błock 19956, s. 382] (opis w tekście) 


Poszczególne ścieżki w tym drzewie (np. A 1 — Bi — C , — D * — ...) przed¬ 
stawiają możliwy przebieg konwersacji. Każda z tych konwersacji rozpoczyna 
się jednym z ciągów znaków należących do listy A , np. Ai, po którym nastę¬ 
puje odpowiedź maszyny (znajdująca się na liście B) — Bi i tak dalej. Ned 
Błock opisuje działanie maszyny korzystającej z drzewa konwersacji w sposób 
następujący: 

Maszyna działa w sposób następujący: rozpoczyna sędzia, cokolwiek wpisze należało 
będzie do jednego z Ai , A n . Maszyna lokalizuje owo A (niech to będzie powiedzmy 
A2398)> P° czym w odpowiedzi podaje -02398? czyli adekwatną odpowiedź na A 2398 
wybraną wcześniej przez programistów. Sędzia wpisuje kolejną wiadomość, a maszyna 
odnajduje ją na liście C, która znajduje się poniżej 02398 w drzewie wypowiedzi i po¬ 
nownie odpowiada jedną z przygotowanych wcześniej odpowiedzi (która uwzględnia to, 
co było powiedziane wcześniej w A 2398 i 02398)• I tak dalej [Błock 19956, s. 383]. 

Zdaniem Błocka maszyna tego typu mogłaby z łatwością zdać test Turinga. 
Znając jednak dokładnie zasady jej działania, nie moglibyśmy przypisać jej 
posiadania inteligencji. Wiemy bowiem, że wykorzystuje ona jedynie dane ze 
swojej pamięci, nie podejmując żadnych procesów rozumowania. Pozostaje 
to w sprzeczności z naszymi najbardziej podstawowymi przekonaniami doty¬ 
czącymi tego, czym jest inteligencja. 

Argument tego samego typu skonstruował również Stanisław Lem. Przed¬ 
stawił go w Summa technologiae. 

Zauważmy ze swej strony, że grę można skomplikować. Mianowicie są do pomyślenia dwa 
rodzaje maszyn. Pierwsza jest „zwykłą” maszyną cyfrową, która jest złożona jak mózg 
ludzki; można z nią grać w szachy, rozmawiać o książkach, o świecie, na wszelkie w ogóle 
tematy. Gdybyśmy ją otworzyli, ujrzelibyśmy ogromną ilość obwodów sprzężonych tak, 
jak są sprzężone obwody neuronów w mózgu, poza tym — jej bloki pamięci itd., itp. 
Druga maszyna jest zupełnie inna. Jest to do planety (albo do kosmosu) powiększony 
Gramofon. Posiada ona bardzo dużo, np. sto trylionów nagranych odpowiedzi na wszel¬ 
kie możliwe pytania. Tak więc, gdy pytamy, maszyna wcale niczego „nie rozumie”, a tylko 
forma pytania, tj. kolejność drgań naszego głosu, uruchamia przekaźnik, który puszcza 
w obroty płytę czy taśmę z nagraną odpowiedzią. Mniejsza o stronę techniczną. Rozu¬ 
mie się, że maszyna taka jest nieekonomiczna, że jej nikt nie zbuduje, bo i to właściwie 
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niemożliwe, i głównie, nie wiadomo po co by to robić. Ale nas interesuje strona teo¬ 
retyczna. Bo jeśli o tym, czy maszyna ma świadomość, decyduje zachowanie, a nie 
budowa wewnętrzna, czyż nie dojdziemy pochopnie do wniosku, że „kosmiczny gramo¬ 
fon” ją posiada — i tym samym wypowiemy nonsens? (A raczej nieprawdę) [Lem 1996a, 
s. 167]. 

Łatwo zauważyć, że argument autorstwa N. Błocka zawiera znacznie więcej 
szczegółów, ale wydaje się, że podstawowe intuicje oraz cele obu autorów były 
w gruncie rzeczy takie same. Hipotetyczna maszyna zaprojektowana przez 
Błocka przechowuje nie tylko odpowiedzi na pytania, ale również odpowiedzi 
na komentarze sędziego itp. Jednakże w Summa technologiae Lem przyznaje 
również, że „kosmiczny gramofon”, który nazwalibyśmy wystarczająco wyra¬ 
finowanym, przechowywałby „nie tylko poszczególne odpowiedzi na możliwe 
pytania, ale całe sekwencje rozmów, jakie tylko mogą być prowadzone” [Lem 
1996a, s. 167]. Doskonale oddaje to intuicje związane z budowaniem drzewa 
konwersacji w przypadku argumentu N. Błocka 2 . 


2.2.2. Johna Searle’a argument chińskiego pokoju 


Kolejnym, bardzo znanym, sformułowaniem argumentu nazwanego tutaj 
argumentem z zupełnego systemu konwersacyjnego, jest argument chińskiego 
pokoju autorstwa J. Searle’a. Przez wielu autorów to właśnie ten argu¬ 
ment uważany jest za najbardziej trafną krytykę testu Turinga (por. np. 
[Casacuberta 2007, s. 69] oraz [Searle 2009]). Jest to o tyle niezrozumiale, że 
jego wymowa wydaje się — w kontekście rozważań nad TT — dokładnie taka 
sama, jak omówione powyżej argumenty z drzewa konwersacji i kosmicznego 
gramofonu. 

Argument, znany pod nazwą chińskiego pokoju, przedstawił Searle po raz 
pierwszy w artykule pod tytułem: „Umysły, mózgi i programy”, który ukazał 
się w piśmie Behauioral and Brain Sciences [Searle 1980]. Obszernie tym 
problemem zajął się także w swojej późniejszej książce poświęconej tematyce 
sztucznej inteligencji i problemowi umysł-ciało, pod tytułem: Umysł, mózg 
i nauka [Searle 1995]. 

Argumentacja Searle’a ma na celu wykazanie, że tzw. silna teza o sztucz¬ 
nej inteligencji ( strong Al) jest błędna 3 . Zwolennicy tej tezy akceptują 
zdaniem Searle’a - dwa założenia: 

1. Proces myślenia może być w pełni opisany przez algorytmy. 

2 Zadziwiające podobieństwo obu argumentów zasługuje na małą uwagę bibliograficzną. 
Pierwsze sformułowanie argumentu N. Błocka znajdziemy w jego pracy Troubles withfunc- 
tionahsm (por. [Błock 1995a[) wydanej w 1978 r. Stanisław Lem sformułował swój argu¬ 
ment już w 1963 r. (por. [Lem 1999, s. 198]). Obydwa argumenty powstały oczywiście 
niezależnie. Warto jednak podkreślić historyczne pierwszeństwo na tym polu Stanisława 
Lema, ponieważ w literaturze powszechnie za „ojca” tego typu argumentacji uznaje się 
Neda Błocka (por. [Łupkowski 2006]). 

3 Warto zauważyć, że wprowadzone przez J. Searle’a rozróżnienie na słabą i silną tezę 
o sztucznej inteligencji nie jest bezdyskusyjnie przyjmowane w literaturze przedmiotu — 
por. np. dyskusję na ten temat w [Miinch 1990]. 



2.2. Filozoficzna teza testu Turinga 


35 


2. Algorytmy można implementować w pewnego rodzaju maszynie auto¬ 
matycznej — komputerze. Odpowiednio skomplikowany i wyrafinowany 
algorytm wytworzy świadomość. 


2.2.2.1. Program R. Sclianka 

Przesłanką, która doprowadziła do sformułowania argumentu chińskiego 
pokoju, był program badawczy Rogera Schanka (z Uniwersytetu Yale). Cho¬ 
ciaż Searle podkreśla, że jego argumentacja odnosi się do każdego rodzaju 
maszyny cyfrowej, to właśnie program Schanka odcisnął szczególne piętno na 
Searle’owskim eksperymencie myślowym. 

Aby uniknąć, problematycznego skądinąd, definiowania inteligencji, Roger 
Schank postanowił położyć nacisk na jeden z jej przejawów, który wydal mu 
się szczególnie charakterystyczny (podobnie jak zrobił to Alan Turing). Zda¬ 
niem Schanka tym, co charakteryzuje ludzką inteligencję — i tylko ludzką 
inteligencję - jest zdolność do rozumienia przekazywanych informacji oraz 
wyciągania z nich wniosków. Zdolność ta uwidacznia się podczas odpowiada¬ 
nia na pytania dotyczące wcześniej usłyszanej historii (zwłaszcza jeśli infor¬ 
macja, o którą pytamy, nie została podana w tej historii explicite). Schank 
(wraz ze współpracownikami) stworzył więc program, który z powodzeniem 
potrafił odpowiadać na pytania dotyczące prostej historii opowiadającej o za¬ 
mawianiu hamburgera w restauracji. Zdaniem Searle’a, zwolennik silnej tezy 
o sztucznej inteligencji wyciągnąłby dwa wnioski z pracy Schanka: 

(i) Maszyna (z programem Schanka) potrafi odpowiadać na pytania doty¬ 
czące przedstawianej jej historii, ponieważ ją rozumie. 

(ii) Algorytmy zaimplementowane w programie Schanka wiernie odzwier¬ 
ciedlają odpowiednie procedury, z których korzystają ludzie. Tym sa¬ 
mym możliwe jest zastosowanie tych algorytmów dla wyjaśnienia tego 
zakresu ludzkich zachowań, który wydal się Schankowi interesujący. 


2.2.2.2. Chiński pokój 

Searle nie godzi się na żaden z obu przedstawionych powyżej wniosków. 
Proponuje rozważenie następującego problemu: załóżmy, że umysł nasz działa 
tak, jak przedstawiają to zwolennicy silnej tezy o sztucznej inteligencji i zba¬ 
dajmy konsekwencje tego założenia. A oto eksperyment myślowy przedsta¬ 
wiony przez Searle’a: 

Wyobraźmy sobie [...], że ktoś z nas jest zamknięty w pokoju i że w pokoju tym jest 
szereg koszy wypełnionych znakami z języka chińskiego. Załóżmy, że osoba ta, podob¬ 
nie jak autor myślowego eksperymentu, nie zna chińskiego, otrzymała jednak napisaną 
w jej ojczystym języku książkę reguł manipulowania znakami języka chińskiego. Reguły 
te opisują używanie symboli w sposób czysto formalny, opisują manipulowanie nimi 
w sposób syntaktyczny, nie semantyczny. Mogą mieć postać: „Wybierz ten znak z po¬ 
dwójnym zakrętasem z kosza numer jeden i połóż go za znakiem z dwoma zawijasami 
z kosza numer dwa” [Searle 1995, s. 28—29]. 
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Dalej Searle pisze: 

Przyjmijmy teraz, że w pokoju pojawiają się jakieś nowe symbole, a osoba w nim sie¬ 
dząca otrzymuje instrukcje, jakie chińskie symbole ma wysłać z pokoju w odpowiedzi 
na te, które się pojawiły. Załóżmy, że siedzący w pokoju nie wie, iż wysyłane przez ludzi 
z zewnątrz do pokoju symbole nazywane są przez nich pytaniami, zaś symbole, które 
siedzący w pokoju wysyła na zewnątrz, nazywane są odpowiedziami na pytania. Przyj¬ 
mijmy poza tym, że programiści napisali na tyle dobry program, zaś siedząca osoba jest 
do tego stopnia dobra w manipulowaniu symbolami, że jej odpowiedzi są nieodróżnialne 
od odpowiedzi osoby faktycznie znającej język chiński. Zatem jakaś osoba zamknięta 
jest w pokoju, w którym wybiera symbole chińskie i wysyła je w odpowiedzi na inne 
pojawiające się w pokoju chińskie symbole. W sytuacji, jaką tu opisałem, nie ma moż¬ 
liwości, by w wyniku takiej manipulacji formalnie zdefiniowanymi symbolami nauczyć 
się języka chińskiego [Searle 1995, s. 28—29]. 

Opisany powyżej eksperyment myślowy ma, zdaniem Searle’a, pokazywać, 
że oba wnioski zwolenników silnej tezy o sztucznej inteligencji (opierające się 
na badaniach Schanka) są błędne. Człowiek w chińskim pokoju nie rozumie 
ani słowa z podawanych mu historii, podobnie jak nie rozumie zadawanych 
pytań i dostarczanych przez siebie odpowiedzi. To co robi osoba w chiń¬ 
skim pokoju (a więc i procesor komputera cyfrowego), to jedynie manipula¬ 
cja symbolami formalnymi (pozbawionymi na tym poziomie jakiegokolwiek 
sensu). Interpretacja dokonywana jest dopiero przez człowieka, który wpro¬ 
wadza dane do pokoju i jest ich odbiorcą. Jeśli więc uznamy, że programy 
komputerowe opisują czysto syntaktyczne operacje na symbolach, to algo¬ 
rytmy, które te programy implementują, nie mogą stanowić jedynego źródła 
zrozumienia ludzkich stanów mentalnych. 

Meritum mojego myślowego eksperymentu jest następujące: realizując taki formalny 
komputerowy program, z punktu widzenia obserwatora z zewnątrz, zachowujemy się 
dokładnie tak, jak byśmy rozumieli język chiński, jednocześnie jednak nie znamy ani 
jednego słowa języka naturalnego [Searle 1995, s. 29], 

Jak się wydaje, wymowa argumentu chińskiego pokoju w odniesieniu do 
testu Turinga jest analogiczna do wymowy zarzutów formułowanych przez 
S. Lema i N. Błocka. System opisywany w omówionym eksperymencie my¬ 
ślowym jest w stanie pozytywnie przejść TT, lecz — zdaniem Searle’a - - nie 
świadczy to o obecności inteligencji w takim systemie. 


2.2.3. Dyskusja 

Przedstawione powyżej sformułowania argumentu z zupełnego systemu 
konwersacyjnego napotykają na pewne problemy w kontekście rozważań 
o TT. W literaturze przedmiotu można znaleźć imponującą liczbę zarzutów 
skierowanych przeciwko konkretnym sformułowaniom interesującego nas ar¬ 
gumentu (por. m.in. [Miinch 1990], [Churchland, Cliurchland 1991], 
[Chalmers 1992], [Crockett 1994], [Kloch 1996], [Lem 19966], [Hauser 1997], 
[Gregory 2000], [Saygin et al. 2001], [Harnish 2002], [Damper 2006], [Hutchens 
2009]), dlatego też skupię się raczej na problemach, które wydają się wspólne 
dla tego typu argumentacji. 
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Jak już zauważyłem (s. 32), argument z zupełnego systemu konwersacyj- 
nego ma w założeniu wykazać nieadekwatność definicji posiadania inteligen¬ 
cji dostarczanej przez TT. Stanisław Lem, Ned Błock i John Searle przedsta¬ 
wiają hipotetyczny system, który pomyślnie przechodzi TT, ale co do którego 
znamy pewne fakty, dotyczące wewnętrznych mechanizmów jego działania, 
które to fakty nie pozwalają na nazwanie rozważanego systemu posiadają¬ 
cym inteligencję. Jednakże — w świetle rozważań dotyczących tego, czy test 
Turinga rzeczywiście ma dostarczać definicji posiadania inteligencji (por. roz¬ 
dział 1.3) - - przytoczone argumenty wydają się wymierzone nieco obok TT 
(czy też może raczej powiedzieć, w pewne wyobrażenie o teście Turinga). 
Test Turinga nie ma dostarczać warunków koniecznych i wystarczających dla 
stwierdzenia istnienia inteligencji w systemach sztucznych. Stanowi jedynie 
pewną propozycję testu, którego pomyślne przejście wskazuje, że maszyna 
posiada pewne interesujące nas własności. Przypomnijmy tutaj cytowaną już 
wcześniej wypowiedź Turinga: 

Nie chcę podawać definicji myślenia , ale jeśli bym musiał, to prawdopodobnie nie był¬ 
bym w stanie powiedzieć nic ponad to, że jest to coś w rodzaju brzęczenia ( buzzing ), 
które zachodzi w mojej głowie. Nie sądzę jednak abyśmy musieli w ogóle zgadzać się 
co do jakiejkolwiek definicji. Najważniejszą sprawą jest aby spróbować wytyczyć linię 
oddzielającą właściwości mózgu człowieka, o których chcemy dyskutować od tych, które 
nas nie interesują. [...] Chciałbym zaproponować pewien test, który można by zasto¬ 
sować do maszyn. Można by nazwać go testem sprawdzającym, czy maszyna myśli. 
Ale lepiej byłoby uniknąć niepotrzebnych dyskusji i powiedzieć, że maszyny, które po¬ 
myślnie przechodzą ów test są (powiedzmy) maszynami Klasy A [Newman et al. 1952, 
s. 3—4]; podkreślenia P.Ł. 

W świetle tych słów i rekonstrukcji oryginalnych założeń testu Turinga, 
przyjęcie tego, że TT ma dostarczać abdukcyjnego wyjaśnienia fenomenu 
posiadania inteligencji wydaje się najbardziej zgodne z intencjami A. M. Tu¬ 
ringa (por. rozdział 1). Jeśli zgodzimy się na taką interpretację propozycji 
Turinga (a wiele argumentów za takim krokiem przemawia), dyskusje wokół 
filozoficznej tezy TT powinny nieco zmienić swoją optykę i nierozerwalnie łą¬ 
czyć się z rozważaniem praktycznego aspektu testu oraz budowaniem nowych 
propozycji, które mogłyby TT zastąpić. Aktualna sytuacja została trafnie 
skomentowana przez G. Piccininiego: 

Autorami znacznej większości literatury poświęconej Turingowi są logicy lub filozofowie, 
którzy zainteresowani są raczej aktualnymi problemami filozoficznymi, niż pomysłami 
samego Turinga [Piccinini 2003, s. 24], 

W tym kontekście powstaje również pytanie o to, czy przy obecnym sta¬ 
nie badań nad umysłem i inteligencją dysponujemy lepszym rozwiązaniem 
niż TT, albo też, ujmując zagadnienie bardziej ogólnie, niż testami wej¬ 
ścia/wyjścia (jak nazywa je Larry J. Crockett; por. [Crockett 1994]). Ned 
Błock pisze — w przytoczonym już wcześniej fragmencie „The Mind as the 
Software of the Brain” (por. [Błock 1995 b, s. 384]) — że koncentrowanie się 
TT na zachowaniu jest wadą propozycji Turinga. To, na czym powinniśmy 
się skupić, to badanie kompetencji. Przyznaje jednocześnie, że zachowanie 
jest jednym z przejawów owej kompetencji. Tym samym, w pewnym sen¬ 
sie, przeczy sam sobie (zwłaszcza jeśli testu Turinga nie będziemy rozumieli 
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jako definicji posiadania inteligencji). Siła propozycji Turinga leży w tym, że 
zaoferował on proste kryterium, które w jego czasach (można zaryzykować 
twierdzenie, że również w obecnych) umożliwiało praktyczne podejście do 
problemu badania inteligencji systemów sztucznych. J. Crockett twierdzi, że 
testy wejścia/wyjścia (opierające się na traktowaniu badanych układów jako 
czarnych skrzynek) mogą pozostać adekwatne nawet jeśli doczekamy się pro¬ 
gramu, który będzie modelem działania ludzkiego umysłu. Opiera się w tej 
kwestii na znanym tekście Ch. Cherniaka „Undebuggability and Cognitive 
Science” [Cherniak 1988]. Cherniak zauważa w nim, że powstanie programu 
modelującego działanie ludzkiego umysłu jest nieodłącznie związane z tym, 
że nie będziemy w stanie zrozumieć kodu owego programu jako całości. Przed¬ 
sięwzięcie zmierzające do zbudowania takiego programu musiałoby być tak 
ogromne, że jego końcowy wynik byłby nie do ogarnięcia przez jego twórców. 
Cherniak wysnuwa ten wniosek, analizując wyniki badań nad ludzkim umy¬ 
słem w zestawieniu z najbardziej wyrafinowanymi programami stworzonymi 
w ramach SDI (Strategie Defense Initiative 4 ) — - por. [Cherniak 1988, s. 406]. 
Zdaniem Ch. Cherniaka: 

Obliczeniowe przybliżenie ludzkiego umysłu byłoby (1) ogromnych rozmiarów, (2) „wie- 
logałęziowe” i zorientowane na podejście holistyczne, (3) uzyskane metodą kolejnych 
zarysów (tj. wygodne obliczeniowo ale formalnie niepoprawne/niekompletne), (4) po¬ 
składane pospiesznie (czyli w dużej mierze stanowiłoby niezbyt eleganckie zestawienie 
różnych procedur). Program modelujący ludzki umysł okazałby się więc zupełnie nie¬ 
podobny do znanego nam oprogramowania [...] Tym sposobem program w pełni mode¬ 
lujący ludzki umysł okazuje się być niepoznawalną rzeczą samą w sobie [Cherniak 1988, 
s. 402], 

Obecnie dysponujemy jedynie wyobrażeniami na temat programu modelu¬ 
jącego całość działania ludzkiego umysłu 5 , jednakże uwagi poczynione przez 
Ch. Cherniaka wydają się intuicyjnie trafne. Uwagi te wskazują na rolę te¬ 
stów wejścia/wyjścia zarówno dla współczesnych, jak i dla przyszłych pro¬ 
gramów modelujących ludzki umysł. Również dyskusje wokół pragmatycznej 
tezy TT i propozycje jego ulepszenia lub zastąpienia (opisane w kolejnym 
podrozdziale) skupiają się na testowaniu zachowania systemów sztucznych. 

Oczywiście TT nie jest jedyną możliwą propozycją i nie posiada gwarancji 
adekwatności po wsze czasy. Jego atrakcyjność leży jednak w inicjowaniu 
zarówno teoretycznych dyskusji, jak i praktycznych przedsięwzięć, począwszy 
od konkursu Loebnera, poprzez Minimum Intelligent Signal Test, na pomyśle 
systemów CAPTCHA skończywszy (por. rozdział 4). 


4 Strategie Defense Initiative byt amerykańskim programem tarczy antyrakietowej ma¬ 
jącej chronić kraje NATO przed atakiem ze strony Związku Radzieckiego. Pod nazwą SDI 
program funkcjonował do 1993 roku. 

5 Warto również nadmienić, że nie ma zgody co do metodologii, która pozwoliłaby na 
uzyskanie takiego programu (por. np. próbę zestawienia paradygmatów, w jakich upra¬ 
wiana jest dyscyplina sztucznej inteligencji w [Caplinskas 1998] lub w [Pellen 2009]). 
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2.3. Pragmatyczna teza testu Turinga 

2.3.1. TT jest za trudny dla inteligentnych maszyn 

Początkowy optymizm dotyczący zbudowania systemu sztucznego, który 
mógłby pozytywnie przejść test Turinga, został szybko ostudzony. Okazało 
się, że — pomimo lokalnych sukcesów — całościowe modelowanie ludzkich 
kompetencji językowych nastręcza wiele problemów. Zrodziło to ideę ograni¬ 
czonego TT. Nałożenie restrykcji na TT ma na celu dokładniejsze sformu¬ 
łowanie sytuacji testowej, a tym samym umożliwienie — w ograniczonym 
zakresie — praktycznego testowania istniejących systemów sztucznych. Naj¬ 
lepiej dziś znaną wersją ograniczonego TT jest konkurs Loebnera. 


2.3.1.1. Ograniczony test Turinga (konkurs Loebnera) 

Pomysł konkursu sięga 1990 roku, kiedy Hugh Loebner wraz z The Cam¬ 
bridge Center for Behavioral Studies rozpisali konkurs na program kompu¬ 
terowy, który najlepiej poradzi sobie w ograniczonym teście Turinga. Na po¬ 
trzeby konkursu przyjęto dwie zasady, dzięki którym możliwe stało się jego 
przeprowadzenie. Po pierwsze, ograniczono tematykę rozmów. Programiści 
startujący w konkursie znają tematykę dla danej edycji, a pytający mają 
obowiązek pozostawania w jej zakresie. Drugie z ograniczeń jest nałożone 
właśnie na pytającego. Ma się on zachowywać w czasie rozmowy tak jakby 
zachowywał się w czasie normalnej codziennej konwersacji (oczywiście doty¬ 
czącej przyjętego wcześniej tematu). Oznacza to mniej więcej tyle, że nie może 
stosować udziwnionych wypowiedzi, trików czy przemyślnych prowokacji. 

Tematami rozmów wybieranymi do konkursu który odbywa się nieprze¬ 
rwanie od 1991 r. — były, między innymi: pogawędki na przyjęciu, rozmowy 
na temat win burgundzkich, niepowodzenia w związkach, dzieła Szekspira, 
moda damska (por. [Shieber 1994, s. 4]). W ostatnich edycjach konkursu 
ograniczenie tematyki rozmów zostało w zasadzie zniesione. W 2006 roku 
program musiał rozpocząć rozmowę od słów: „Hello, my name is John and 
I am a man” lub „Hello, my name is Joan, and I am a woman” 6 . Z kolei w edy¬ 
cji z 2008 istniał już tylko wymóg, aby program wyraźnie określił swoją pleć. 

Ideą konkursu jest, aby każdego roku wzrastały jego trudność oraz sto¬ 
pień wyrafinowania programów biorących w nim udział. Dąży się również do 
ustalenia jednolitego protokołu przeprowadzania konkursu, tak aby wyniki 
kolejnych jego edycji były jak najbardziej porównywalne. Proces ten ma w 
konsekwencji doprowadzić do powstania programu, który zda klasyczny TT 
(por. [Loebner 2009], [Copple 2009]). Czy tak rzeczywiście się stanie, pozo¬ 
staje pytaniem otwartym. Właśnie owo pytanie jest najbardziej znaczące w 
kontekście ograniczonego TT. Pozytywna odpowiedź na nie uzasadnia bo- 


6 Zasady obowiązujące w kolejnych edycjach konkursu Loebnera oraz listę ich 
zwycięzców zainteresowany Czytelnik może znaleźć na stronie interentowej projektu: 
http: //loebner.net/Prizef/loebner- prize.html . 
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wiem ideę ograniczonego testu Turinga traktowanego jako dobry punkt wyj¬ 
ścia dla programów, które (w przyszłości) będą mogły zdać klasyczny TT. 
Zdaniem krytyków ograniczonego TT — takich jak np. S. Shieber — sta¬ 
nowi on jedynie konkurs na program najlepiej posługujący się sztuczkami, 
które pozwalają zwodzić sędziów (por. też [Mauldin 1994]). Nie przybliża nas 
jednak wcale do celu, jakim ma być zdanie klasycznego TT przez maszyny. 
S. Shieber w „Lessons From a Restricted Turing Test” pisze: 

[...] trudno wyobrazić sobie czysto naukowy cel jaki mógłby przyświecać konkursowi 

Loebnera. Test Turinga z kolei — w swoim oryginalnym ujęciu — miał swój jasny cel: 

dostarczyć naukowego kryterium dla zademonstrowania, że stworzony przez człowieka 

artefakt wykazuje inteligentne zachowania. Nawet ten cel zagubiony został w konkursie 

Loebnera [Shieber 1994, s. 12]. 

Ta mocna krytyka Shiebera, skierowana przeciwko idei konkursu Loeb¬ 
nera, opiera się na analogii z konkursem Kremera na pierwsze urządzenie 
latające napędzane silą mięśni ( human powered flight). Nagrodę Kremera, 
ustanowioną w roku 1959, uzyskał zespól Paula Macready’ego w roku 1977 
(za projekt Gossamer Condor). Zdaniem Shiebera ów konkurs — w przeci¬ 
wieństwie do konkursu Loebnera jest przykładem dobrze sformułowanego 
i ogłoszonego w odpowiednim czasie. Sukces konkursu Kremera uwarunko¬ 
wany był dwoma czynnikami: 

1. Cele konkursu były jasno sformułowane, a w czasie, kiedy go ustano¬ 
wiono, nie prowadzono badań nad urządzeniami latającymi napędza¬ 
nymi siłą mięśni. Cel konkursu był więc dobrze określony — doprowa¬ 
dzić do rozwoju badań w tej dziedzinie. 

2. Dyscypliny naukowe leżące u podstaw konstrukcji takich urządzeń 
(aerodynamika, mechanika, anatomia, fizjologia, materiałoznawstwo) 
były dobrze rozwinięte i ugruntowane. 

Zdaniem Shiebera o tych czynnikach nie możemy mówić w kontekście kon¬ 
kursu Loebnera, co sprawia, że z naukowego punktu widzenia nie jest on 
w stanie spełnić pokładanych w nim nadziei. 

Inny zarzut, sformułowany przez S. Zdenka, dotyczy ograniczeń narzu¬ 
canych na TT przez zasady konkursu Loebnera (por. [Zdenek 2001]). Jego 
zdaniem wymagania narzucane przez organizatorów konkursu Loebnera spra¬ 
wiają, że rozmowy testowe mają sprowadzać się jedynie do wymiany informa¬ 
cji (sędziowie nie powinni zadawać żadnych podchwytliwych czy obraźliwycli 
pytań, powinni trzymać się z góry ustalonego tematu), przy czym najlepiej 
gdyby dotyczyły one obojętnych faktów. Ze względu na charakter owych roz¬ 
mów, zasady konkursu Loebnera ignorują — zdaniem Zdenka — fakt ścisłego 
związku pomiędzy językiem a kontekstem społecznym (szczególnie w zakresie, 
w jakim użycia języka warunkowane są przez kompetencje komunikacyjne). 

Warto nadmienić, że choć zagadnienie to — zdaniem S. Zdenka — jest 
ignorowane w kontekście konkursu Loebnera, to zostało ono zauważone 
(i docenione) przez producentów komercyjnego oprogramowania z zakresu 
NLP ( Natural Language Processing). Dobrym tego przykładem są bada¬ 
nia nad społecznymi interakcjami chatterbotów prowadzone np. w ramach 
tzw. involvement framework (por. m.in. [De Angeli et al. 1999], [Dryer 1999], 
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[De Angeli, Lynch, Johnson 2001], [De Angeli, Graham, Johnson, Coventry 
2001], [Gratch, Marsella 2005] oraz [van Vugt et al. 2007]). 


2.3.1.2. TT a pytania subkognitywne 

R. French w artykule „Subcogniton and the Limits of the Turing Test” 
[French 1990] również stwierdza, że TT jest za trudny. Uważa go wręcz za 
bezużyteczny jako test posiadania inteligencji przez systemy sztuczne, a to 
z tego powodu, iż nigdy nie będą one w stanie go zdać. Być może nawet 
filozoficzna teza TT jest słuszna, ale teza pragmatyczna jest zupełnie błędna. 
Uzasadnieniem takiego stanu rzeczy mają być dwa fakty: 

1. TT jest zorientowany kulturowo i antropomorficznie — jest testem ludz¬ 
kiej inteligencji. 

2. Poznawczy (kognitywny) oraz fizyczny poziom inteligencji są nieroz¬ 
łączne. 

Zdaniem Frencha możliwe jest zaprojektowanie serii tzw. pytań subkogni- 
tywnych ( subcognitive ąuestions ), to znaczy pytań, które odsłaniają niskopo- 
ziomowe struktury poznawcze ( low-level cognitive structures ). Pomysł tego 
rodzaju pytań opiera się na badaniach z dziedziny psychologii poznawczej, 
w szczególności zaś badań nad prymowaniem 7 ( associatiue priming). Zauwa¬ 
żono np., że jeżeli zaprezentujemy badanym pewien zestaw słów, to znacznie 
szybciej są oni w stanie rozpoznać słowa, które poprzedzono słowem w pewien 
sposób z nim związanym. I tak np. słowo „sól” będzie rozpoznane szybciej, 
jeżeli poprzedzone będzie słowem „pieprz” niż, powiedzmy, słowem „but” czy 
też ciągiem znaków „gloff”. Ludzie zdają się więc dysponować swego rodzaju 
sieciami połączeń pomiędzy znaczeniami słów, które tworzą się na drodze co¬ 
dziennych doświadczeń. Te sieci połączeń wydają się również w dużej mierze 
nieuświadamiane. Pytania subkognitywne mają się odwoływać do zależności 
zawartych w takich właśnie sieciach. Zdaniem Frencha każdy odpowiednio 
rozbudowany zbiór pytań zawiera pytania tego typu. Aby maszyna poradziła 
sobie z pytaniami subkognitywnymi, powinna doświadczać świata w podobny 
do ludzkiego sposób i w zbliżony sposób zbierać doświadczenia na jego temat. 
Nie pomoże tutaj ograniczanie TT w sposób, w jaki czyni się to w konkursie 
Loebnera: 

Z całą pewnością, nie chcielibyśmy ograniczać testu Turinga do pytań typu: „Jakie mia¬ 
sto jest stolicą Francji?” lub „Ile boków ma trójkąt?”. Jeśli zgodzimy się, że inteligencja 
w ogóle musi mieć coś wspólnego ze zdolnością kategoryzacji, dostrzegania analogii itp., 
chcielibyśmy zadawać pytania, które mogłyby testować te zdolności. Lecz właśnie owe 
pytania umożliwiają nam, w niezawodny sposób, zdemaskowanie komputera [French 
1990, s. 63]. 


7 „Poprzedzanie [prymowanie lub torowanie — przyp. P.Ł.] ( priming ) — zjawisko mo¬ 
dyfikacji reakcji na bodziec w wyniku uprzedniego działania innego bodźca (prymy), w jakiś 
sposób powiązanego z bodźcem docelowym” [Nęcka et al. 2006, s. 646] (por. też [Strelau 
2000, s. 795]). 
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French proponuje, aby pytania subkognitywne wykorzystać w teście Tu¬ 
ringa za pomocą „gry w ocenianie” ( rating gamę). Gra taka polega na tym, 
że sędzia prezentuje graczowi pary obiektów. Zadaniem gracza jest ocena po¬ 
ziomu dopasowania tych obiektów do siebie. Np. „Oceń na skali 0-10, jak 
torebka nadaje się na broń”, lub „Oceń, jak »Flugblogs« nadaje się na na¬ 
zwę misia przytulanki”. Zdaniem Frencha zadania tego typu odwołują się 
do wspomnianych niskopoziomowych struktur poznawczych i umożliwią sę¬ 
dziemu łatwe zdemaskowanie maszyny w teście Turinga. 

Kontrargumentem dla mocnej tezy zaproponowanej przez R. Frencha jest 
algorytm PMI-IR, autorstwa Petera D. Turneya, przedstawiony w pracy pod 
wymownym tytułem „Answering subcognitive Turing test ąuestions: A reply 
to French” [Turney 2001]. Program implementujący ten algorytm wykorzy¬ 
stuje informacje statystyczne uzyskane z dużej kolekcji tekstów (zaczerpnię¬ 
tych z Internetu). Badania Turneya wykazują, że jego program radzi sobie 
z pytaniami subkognitywnymi zaproponowanymi przez Frencha w stopniu 
porównywalnym do ludzkiego. Przykładowym zadaniem, na którym Turney 
testował swój program było, między innymi: oceń (w skali 1 10) przydatność 
skórki od banana, łupin orzechów kokosowych i radia jako instrumentów mu¬ 
zycznych. Program zwrócił następujące wyniki: skórka od banana: 1, łupiny 
orzechów kokosowych: 10, radio: 4. Wyniki te wpisują się w schemat odpo¬ 
wiedzi udzielanych przez ludzi, którzy najniżej oceniali przydatność skórki od 
banana, najwyżej zaś przydatność łupin orzechów kokosowych (radio uzyski¬ 
wało wyniki pośrednie). Dodatkowo metoda statystyczna zastosowana w pro¬ 
gramie umożliwia mu wyszukiwanie i rozpoznawanie synonimów słów (tutaj 
program Turneya radzi sobie podobnie jak człowiek zdający egzamin języ¬ 
kowy TOEFL). 


2.3.2. TT jest za mało restrykcyjny 

Opinia, zgodnie z którą TT jest za trudny, występuje w literaturze przed¬ 
miotu znacznie rzadziej, niż pogląd przeciwny — że TT jest za łatwy. 


2.3.2.1. Całościowy test Turinga 

W artykule „Mind, Machines and Turing: the Indistinguishability of In- 
distinguishables” Steven Harnad zaproponował pewną skalę testów Turinga 
(por. Harnad [2000]). Skala ta jest pięciostopniowa i ma obrazować poziomy 
trudności gry w naśladownictwo. Poziomy te to kolejno: tl, T2, T3, T4 oraz 
T5 - ich zestawienie oraz charakterystyki zawiera tabela 2.1. 

Poziomem, który — zdaniem Harnada - ma największe znaczenie dla 
przyszłości testu Turinga jest poziom T3, określany częściej jako całościowy 
test Turinga ( Total Turing Test — TTT). Poziomy tl oraz T2 są za słabe 
dla modelowania rzeczywiście ludzkiej inteligencji, ponieważ to, co badają, to 
jedynie (mniej lub bardziej arbitralnie) wybrane aspekty ludzkich zdolności 
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Tablica 2.1. Skala TT wg Harnada (na podstawie: [Harnad 2000], [Saygin et al. 2001| 
oraz [French 2000]) 


Poziom 

Opis 

ti 

Modele, które oddają jedynie część naszych zdolności poznawczych (poziom 
reprezentowany obecnie przez SI). 

T2 

Gra w naśladownictwo taka, jak ją opisał Turing. 

T3 

Zupełna nieodróżnialność w funkcjach behawioralnych — wygląd fizyczny sys¬ 
temu sztucznego nabiera tutaj znaczenia. 

T4 

Nieodróżnialność na poziomie mikrofunkcji (nieodróżnialność na poziomie 
każdego neuronu czy neurotransmitera — przy czym mogą być one wyko¬ 
nane z dowolnego materiału). 

T5 

Nieodróżnialność na poziomie elektronów (empiryczna), jedyne różnice mogą 
wystąpić na poziomie użytej do konstruowania różnych systemów GUTE. 


poznawczych. Co więcej, poziom T2 napotyka na problem ugruntowania sym¬ 
boli (symbol grounding problem ). Zdaniem Harnada znaczenia symboli są — 
przynajmniej częściowo — wyprowadzane z interakcji ze światem zewnętrz¬ 
nym. Dlatego właśnie Harnad postuluje, aby całościowemu testowi Turinga 
poddawane były roboty, które posiadają możliwość pełnej interakcji ze śro¬ 
dowiskiem, w którym funkcjonują. Dzięki temu możliwe będzie całościowe 
testowanie ich funkcji behawioralnych. Aby pozytywnie przejść TTT, zacho¬ 
wania i wygląd robota poddawanego testowi musiałyby być nieodróżnialne 
od takich samych zachowań i wyglądu ludzi. Niestety, Harnad nie precyzuje, 
co dokładnie należy do „całości funkcji behawioralnych”. Tak ogólnie zaryso¬ 
wane kryterium, ze względu na które mielibyśmy porównywać ludzi i roboty, 
wydaje się zupełnie bezużyteczne. 

Warto nadmienić, że Harnad nie odrzuca poziomu T2 (czyli oryginalnej 
propozycji Turinga) jako nieadekwatnego, ale wskazuje na fakt, że każdy 
robot, który zda test poziomu T3, zda również test poziomu T2. Jeśli chodzi 
o poziomy T4 i T5, Harnad uważa ich osiągnięcie za w zasadzie utopijne. Jego 
zdaniem to właśnie poziom T3 (całościowy test Turinga) udostępnia nam 
odpowiednie środki, aby rozstrzygnąć, czy dana maszyna posiada inteligencję. 

[...] to właśnie T3, nie zaś T4 czy T5, pozostanie ostatecznym arbitrem. Powód ku temu 
jest prosty (i znowu jest on już zawarty w kryterium nierozróżnialności funkcjonalniej 
autorstwa Turinga): nie tylko zwyczajni ludzie nie potrafią czytać w umysłach, nie 
potrafią tego również inżynierowie. Wszyscy są ograniczeni barierą problemu innych 
umysłów. Funkcja jest jedynym empirycznym kryterium [Harnad 2000, s. 441-442], 


2.3.2.2. Rzeczywiście całościowy test Turinga 

Wydawałoby się, że już nie można bardziej „utrudnić” TT, ale zdaniem 
P. Schweizera nawet na poziomie całościowego testu Turinga nadal nie dyspo¬ 
nujemy pełną możliwością orzekania o inteligencji porównywalnej do ludzkiej. 
Aby taką możliwość otrzymać, powinniśmy skorzystać z zaproponowanego 
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przez niego rzeczywiście całościowego testu Turinga (Truły Total Turing Test 
— TTTT). 

Schweizer zgadza się z Harnadem, że przypisujemy posiadanie inteligen¬ 
cji innym ludziom, obserwując ich zachowania (a więc na poziomie analizy 
funkcjonalnej), ale zauważa, że jest to możliwe tylko dzięki temu, że mamy 
pewną ogólną wiedzę na temat typu podmiotu, o którym chcemy orzekać. Po¬ 
siadamy coś, co Schweizer nazywa historycznym rejestrem (historical record) 
zdolności kognitywnych podmiotu tego rodzaju, jakim jest człowiek (człowiek 
stworzył język, narzędzia, gry itp.). P. Schweizer proponuje więc długotermi¬ 
nowe, ewolucyjne kryterium badania inteligencji, podkreślając, że: 

[...] TTTT nie stanowi testu dla indywidualnych systemów poznawczych. Jest on raczej 
pomyślany jako test możliwości pewnych architektur poznawczych, których przedsta¬ 
wicielami są poszczególne systemy poznawcze. TTTT nie implikuje więc tego, że każda 
osoba (lub robot) aby zostać uznaną za inteligentną musiałaby [...] dokonać wszystkich 
przełomowych odkryć w historii ludzkości [Schweizer 1998, s. 267-268]. 

W tym świetle propozycję Harnada należałoby raczej zakwalifikować do 
poziomu tl (w jego własnej hierarchii). Zdaniem Schweizera, naczelną wadą 
całościowego testu Turinga jest to, że nakazuje badanie pojedynczych egzem¬ 
plarzy podmiotów poznawczych operujących na modelach świata zadanych 
im a priori. Zamiast tego należałoby się raczej skupić na badaniu typów pod¬ 
miotów poznawczych działających w realnym świecie na przestrzeni określo¬ 
nego czasu (por. [Schweizer 1998, s. 267]). Dopiero kiedy podmioty poznawcze 
(rozpatrywane jako pewien typ architektury poznawczej) przejdą tak rozu¬ 
miany rzeczywiście całościowy test Turinga, będziemy mogli z powodzeniem 
stosować tradycyjny test Turinga oraz całościowy test Turinga w odniesieniu 
do poszczególnych egzemplarzy podmiotów poznawczych 8 . 

Celem S. Harnada oraz P. Schweizera było ulepszenie testu Turinga. Ulep¬ 
szenie to dotyczy nie tyle samej konstrukcji TT, ile raczej kryterium posiada¬ 
nia inteligencji, na którym się on opiera. Zdaniem Harnada i Schweizera, kry¬ 
terium to jest zbyt wąskie, aby rzeczywiście nadawało się do badania sztucz¬ 
nych systemów poznawczych. S. Harnad proponuje więc, aby testować całość 
funkcji behawioralnych takiego systemu, zaś R. Schweizer posuwa się jesz¬ 
cze dalej, proponując długoterminowe, ewolucyjnie zorientowane kryterium 
badania typów architektur poznawczych (a nie pojedynczych ich przedstawi¬ 
cieli). Niewątpliwie obie te propozycje są bardzo interesujące pod względem 
teoretycznym. Atrakcyjność zarysowanych w nich kryteriów oceny sztucz¬ 
nych systemów poznawczych kryje się w tym, że mają maksymalnie zbliżyć 
się do kryteriów, z których korzystamy na co dzień, przypisując innym lu¬ 
dziom stany mentalne. Jest to jednocześnie poważna wada całkowitego testu 


8 Modyfikacje testu Turinga w podobnym duchu odnajdziemy np. w artykule „Intel- 
ligence is not Enough: On the Socialization of Talking Machines” [Ronald, Sipper 2001], 
w którym autorzy starają się zidentyfikować te aspekty inteligencji, które nie mogą zostać 
zanalizowane w oryginalnym teście Turinga. Ciekawa jest również propozycja „długotermi¬ 
nowego testu Turinga” przedstawiona przez B. Edmondsa w tekście „The Constructiblity 
of artificial intelligence (as defined by Turing test)”, [Edmonds 2000]. Z kolei Eugeniusz 
Szumakowicz używa argumentacji zbliżonej do tej zastosowanej przez P. Schweizera, aby 
wykazać zupełną nieadekwatność kryterium posiadania inteligencji oferowanego przez test 
Turinga (por. [Szumakowicz 2000], por. też [Łupkowski 2005a]). 
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Turinga i rzeczywiście całkowitego test Turinga — liczba aspektów, które 
należałoby brać pod uwagę, przeprowadzając takie testy, praktycznie dys¬ 
kwalifikuje je jako rzeczywiste narzędzie badawcze. Warto zwrócić uwagę na 
fakt, że — stosunkowo wąskie - kryterium zaproponowane przez Turinga nie 
było przypadkowe. Zdaniem Turinga: „Najważniejszą sprawą jest aby spró¬ 
bować wytyczyć linię oddzielającą właściwości mózgu człowieka, o których 
chcemy dyskutować od tych, które nas nie interesują” [Newman et al. 1952, 
s. 3-4]. Dzięki takiemu podejściu możemy sobie wyobrazić praktyczne wy¬ 
korzystanie testu Turinga (na co wskazuje choćby konkurs Loebnera czy też 
systemy CAPTCHA opisane w rozdziale 4). W tym kontekście propozycjami 
znacznie bardziej interesującymi niż TTT i TTTT są odwrócony test Tu¬ 
ringa, Minimum Intelligence Signal Test oraz test lady Lovelace omówione w 
rodziale czwartym tej książki. 


2.4. Twierdzenie Harraha w kontekście TT 


Argument matematyczny jest jednym z najbardziej interesujących rozpa¬ 
trywanych przez Turinga w „Computing Machinery”. Jest on interesujący za¬ 
równo w kontekście samego testu Turinga, jak i jako element szeroko zakrojo¬ 
nych dyskusji dotyczących zagadnienia sztucznej inteligencji oraz ograniczeń 
ludzkiego umysłu. 

Za A. M. Turingiem przypomnę sformułowanie tego argumentu: 

Istnieją wyniki na gruncie logiki matematycznej, które mogą zostać wykorzystane dla 
wykazania pewnych ograniczeń maszyn o stanach dyskretnych. Najbardziej znanym 
z takich wyników jest twierdzenie Godła [...] Istnieją również inne — pod wieloma 
względami podobne — wyniki osiągnięte przez Churcha, Kleene’go, Rossera i Turinga. 
Szczególnie ostatni z tych wyników jest wart rozważenia w tym miejscu, ponieważ bez¬ 
pośrednio odnosi się on do maszyn [o stanach dyskretnych] [...]. Wynik ten głosi, że 
pewnych rzeczy takie maszyny nie są w stanie zrobić. Jeśli taka maszyna musiałaby 
udzielać odpowiedzi na pytania takie, jak w grze w naśladownictwo, istniałyby pytania, 
na które udzieliłaby ona błędnych odpowiedzi, lub nie udzieliłaby ich wcale (niezależnie 
od ilości czasu, jaki miałaby do dyspozycji) [Turing 1950, s. 444]. 

Wyniki, o których wspomina Turing w przytoczonym powyżej cytacie, 
określane są mianem twierdzeń limitacyjnych 9 . Warto wspomnieć, że te 
twierdzenia (zwłaszcza twierdzenie Godła) są bardzo często wykorzysty¬ 
wane w dyskusjach o naturze ludzkiego umysłu (por. m.in. [Lucas 1961], 
[Marciszewski 1998], [Woleński 1999], [Penrose 2000], [Hetmański 2000], 
[Shagrir 2002], [Krajewski 2003]). 

Z perspektywy tej pracy szczególnie interesujące są jednak wyniki osiąg¬ 
nięte na gruncie logiki pytań w postaci rozszerzonego twierdzenia Harraha. 
Wynika to z naturalnego — moim zdaniem — potraktowania testu Turinga 
jako pewnego systemu pytań i odpowiedzi (por. rozdział 3.1). Logika pytań 
dostarcza narzędzi użytecznych do zbadania takiego systemu oraz konsekwen¬ 
cji tego, że w teście bierze udział maszyna. Taki krok pozwala również — do 

9 Sformułowania twierdzeń, o których pisze Turing, można znaleźć np. w [Krajewski 
2003, s. 63-71] oraz w [Murawski 2000]. 
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pewnego stopnia — uniknąć bardzo problematycznych (i, jak się wydaje, na 
dzień dzisiejszy nierozstrzygalnych) dyskusji dotyczących algorytmiczności 
(lub jej braku) ludzkiego umysłu. 

Przyjmuję tutaj oryginalne założenia testu Turinga, przy których to sędzia 
zadaje pytania (oraz ewentualnie komentuje odpowiedzi), zaś gracz udziela 
jedynie odpowiedzi (nie generuje pytań). Na „wejściu” gracza-maszyny mogą 
więc pojawić się wypowiedzi będące pytaniami, zdaniami oznajmującymi lub 
wypowiedzi nie należące do żadnej z tych kategorii (w kontekście testu Tu¬ 
ringa interesujące będą pytania i zdania oznajmujące). Na „wyjściu” gracza- 
-maszyny pojawiały się będą jedynie zdania oznajmujące (będące odpowie¬ 
dziami udzielanymi przez maszynę na pytania sędziego). Odnośnie do zdań 
oznajmującycli zakładam, że maszyna posiada początkowy ich zbiór (można 
go określić jako początkową bazę wiedzy maszyny). Do tego zbioru w miarę 
trwania testu — dodawane są kolejne zdania (np. poprzez dołączanie wyja¬ 
śnień udzielanych przez sędziego). Zakładam również, że maszyna dysponuje 
pewnymi „możliwościami dedukcyjnymi”, które dobrze imitują odpowiednie 
możliwości sędziego. 

Zgodnie z oryginalnymi założeniami testu Turinga, maszyna udziela jedy¬ 
nie odpowiedzi, nie formułując pytań. Można przyjąć, że odpowiedzi maszyny 
będą zdaniami oznajmującymi. Przyjmuję, że maszyna udziela odpowiedzi 
bezpośrednich w sensie Belnapa. Są to takie odpowiedzi, które „bezpośrednio 
i precyzyjnie odpowiadają na pytanie, podając dokładnie tyle informacji ile 
potrzeba” [Belnap 1969, s. 124], Założenie to — w dużym stopniu - gwa¬ 
rantuje utrzymanie płynności konwersacji w teście Turinga 10 oraz wydaje się 
spełniać wymaganie nałożone przez Turinga na zachowanie gracza w TT, mó¬ 
wiące, że powinien on udzielać odpowiedzi tak, jakby zrobił to człowiek. Co 
więcej, przyjmuję, że odpowiedzi bezpośrednie udzielane przez maszynę mu¬ 
szą być dodatkowo trafne z uwagi na warunki zadania (wyrażonego pytaniem 
sędziego). 

O graczu-maszynie w TT zakładam również, że wykonywane przez niego 
procedury muszą być efektywne. Intuicyjne pojęcie procedury efektywnej * 11 
wyeksplikuję tutaj za pomocą pojęcia funkcji rekurencyjnej, utożsamiając 
wykonywanie procedury efektywnej z obliczaniem (wartości) funkcji rekuren¬ 
cyjnej. Innymi słowy, przyjmę tutaj, że „aktywność” gracza-maszyny polega 
na wykonywaniu pewnych algorytmów, będących w istocie obliczaniem okre¬ 
ślonych funkcji rekurencyjnych (całkowitych lub częściowych). 

Jak wiadomo, pojęcie funkcji rekurencyjnej można określać na wiele rów¬ 
noważnych sposobów (por. np. [Murawski 2000], [Hopcroft, Ullman 2003], 
[Papadimitriou 2002], [Dalen 2002]). Skorzystam z ujęć przedstawionych 
w [Krajewski 2003] oraz [Ławrow, Maksimowa 2004], 


10 Należy pamiętać, że zdaniem Turinga zarówno jedna, jak i druga strona biorąca 
udział w zaprojektowanym przez niego teście miały zachowywać się tak, jak przy codziennej 
konwersacji. 

11 Za kluczowe własności procedury efektywnej uważa się skończoną opisywalność i skła¬ 
danie się z kolejnych kroków, z których każdy może być wykonany w sposób mechaniczny 
— por. [Hopcroft, Ullman 2003, s. 172], 
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Rozważam funkcje — całkowite lub częściowe — o argumentach i warto¬ 
ściach będących liczbami naturalnymi; mówiąc dalej o liczbach, będę miał 
na myśli liczby naturalne, natomiast symbolem N oznaczał będę zbiór liczb 
naturalnych. 

Mianem funkcji wyjściowych określa się: funkcję stalą Z{x) = 0, funkcję 
następnika S(x) = x + 1 oraz funkcje rzutowania J"(xi, ..., x n ) = Xj, dla 
dowolnego n £ N oraz i < n. 

Mówimy, że funkcja / dana równością: 


f(x i,...,x n ) = g(hi(x 1: ...,x n ), ...,hm(xi,...,x n )) 


jest otrzymywana z funkcji g , h±,..., h m poprzez operację składania. 

Powiemy, że funkcja n +1 argumentowa / jest otrzymywana z n-argumen- 
towej funkcji g oraz n+2-argumentowej funkcji h za pomocą operacji rekursji 
prostej wówczas, gdy / spełnia następujące równości: 


/(0,xi, ...,x n ) = g(xl,...,X n ) 
f(x + l,xi, ...,x n ) = h(f(x,x i, ...,x n ),x,xi,...,x n ) 


Funkcja pierwotnie rekurencyjna to każda funkcja, którą można otrzymać 
w skończenie wielu krokach z funkcji wyjściowych poprzez zastosowanie ope¬ 
racji składania oraz operacji rekursji prostej. 

Mówimy, że funkcja / jest otrzymana z funkcji g poprzez operację mini¬ 
mum wówczas, gdy f(x i, ..., x n ) jest określone i równe y wtedy i tylko wtedy, 
gdy g{x i,..., x n , 0), ..., g(x i,..., x n , y — 1) są wszystkie określone i różne od 0, 
a g(x i, ...,x n ,y) = 0. 

Funkcja częściowo rekurencyjna to funkcja, którą można otrzymać z funk¬ 
cji wyjściowych za pomocą skończonej liczby zastosowań operacji składania, 
operacji rekursji prostej oraz operacji minimum. 

Mówiąc dalej o funkcjach rekurencyjnych, będę miał na myśli funkcje 
częściowo rekurencyjne. Całkowite funkcje (częściowo) rekurencyjne określał 
będę mianem funkcji ogólnie rekurencyjnych. 

Na mocy tezy Churcha-Turinga klasa funkcji obliczalnych jest równa kla¬ 
sie funkcji (częściowo) rekurencyjnych (por. [Hopcroft, Ullman 2003, s. 192], 
[Murawski 2000, s. 63]). 

Mając dane pojęcie funkcji rekurencyjnej, mogę następnie określić pojęcia 
zbioru rekurencyjnego oraz zbioru rekurencyjnie przeliczalnego ( recurswely 
enumerable). Aby to zrobić, scharakteryzuję pojęcie funkcji charakterystycz¬ 
nej. Funkcją charakterystyczną zbioru (liczb naturalnych) X nazywamy funk¬ 
cję: K\ ■ N —t- {1,0} spełniającą następujący warunek: 



Zbiór X C N jest rekurencyjny wtedy i tylko wtedy, gdy funkcja charak¬ 
terystyczna zbioru X jest ogólnie rekurencyjna. 

Pojęcie zbioru rekurencyjnego odnosi się, ściśle rzecz biorąc, do zbiorów 
liczb naturalnych. Gdy pragniemy je zastosować do zbioru wyrażeń (co bę- 
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dzie niezbędne w kontekście rozważań poświęconych testowi Turinga), za¬ 
kładamy, że elementy tego zbioru są kodowane przez liczby naturalne. Zbiór 
wyrażeń W określamy mianem rekurencyjnego wówczas, gdy zbiór kodów ele¬ 
mentów zbioru W jest rekurencyjny. Intuicyjny sens pojęcia rekurencyjnego 
zbioru wyrażeń jest następujący: zbiór wyrażeń W jest rekurencyjny wtedy 
i tylko wtedy, gdy istnieje mechaniczna metoda, która dla dowolnego wyra¬ 
żenia w pozwala w skończonej liczbie z góry przepisanych kroków stwierdzić, 
czy w £ W, czy też w W. Mówiąc ogólnie, zbiór wyrażeń jest rekurencyjny 
wówczas, gdy istnieje efektywna metoda rozstrzygania czy dane, dowolne wy¬ 
rażenie jest elementem tego zbioru, czy też nie jest. 

Mówimy, że relacja R C N™ jest rekurencyjna wtedy i tylko wtedy, gdy 
funkcja charakterystyczna relacji R jest ogólnie rekurencyjna. 

Funkcją charakterystyczną relacji R C N” nazywamy funkcję: Kr : N n —>• 
{1,0} spełniającą następujący warunek: 


K R ( Xl , ...,x n ) 


0, jeśli (xi ,..., x n ) £ R 
1, jeśli (xi ,...,x n )<£R 


Zbiór X C N jest rekurencyjnie przeliczalny wtedy i tylko wtedy, gdy dla 
pewnej relacji R C N 2 takiej, że funkcja charakterystyczna relacji R jest 
ogólnie rekurencyjna zachodzi: 


(*) X = {x £ N : 3yR(x,y)} 


Można udowodnić (por. [Dalen 2002, s. 278]), że warunek (*) jest równo¬ 
ważny warunkowi: 


(**) X jest zbiorem wartości pewnej funkcji (częściowo) rekurencyjnej. 


Podobnie jak poprzednio, pojęcie zbioru rekurencyjnie przeliczalnego można 
- pośrednio — odnieść do zbioru wyrażeń. Intuicyjnie rzecz biorąc, rekuren¬ 
cyjnie przeliczalny zbiór wyrażeń W to taki, dla którego istnieje mechaniczna 
metoda, która dla dowolnego wyrażenia w £ W pozwala w skończonej liczbie 
z góry przepisanych kroków stwierdzić, że w £ W, natomiast gdy w W, to 
metoda ta może nie dać żadnej odpowiedzi na pytanie „Czy w £ W ?” Mówiąc 
ogólnie, zbiór wyrażeń jest rekurencyjnie przeliczalny wówczas, gdy istnieje 
efektywna metoda, która dla każdego wyrażenia należącego do tego zbioru, 
pozwala pokazać/rozstrzygnąć, że jest tak właśnie. 

Jest oczywiste, że każdy rekurencyjny zbiór wyrażeń jest zarazem rekuren¬ 
cyjnie przeliczalny, jednakże nie każdy zbiór rekurencyjnie przeliczalny jest 
rekurencyjny. 

W celu zbadania konsekwencji twierdzenia Harraha dla testu Turinga 
posłużę się rozszerzoną wersją tego twierdzenia zaproponowaną w artykule 
„Interrogatives, Recursion and Incompleteness” autorstwa A. Wiśniewskiego 
i J. Pogonowskiego [Wiśniewski, Pogonowski 2010]. W pierwszej kolejności 
przytoczę jednak twierdzenie Harraha w jego oryginalnym sformułowaniu: 

Twierdzenie 1. Niech L będzie językiem takim, że: (i) istnieje nieskończe¬ 
nie wiele wyrażeń języka L, które są uporządkowane alfabetycznie, (ii) pewne 
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wyrażenia języka L są zdaniami; zbiór zdań jest rekurencyjny. Załóżmy, że ist¬ 
nieje zbiór pytań S taki, że: (iii) S jest rekurencyjnie przeliczalny, (iv) każde 
pytanie języka L posiada nieskończenie wiele odpowiedzi bezpośrednich lub 
można mu przypisać nieskończenie wiele odpowiedzi w sposób neutralny lo¬ 
gicznie, (v) dla każdego pytania Q zbiór odpowiedzi bezpośrednich na Q jest 
rekurencyjnie przeliczalny, (vi) odpowiedzi bezpośrednie na pytania ze zbioru 
S są zdaniami języka L. Wtedy istnieje zbiór X będący zbiorem zdań języka 
L taki, że (1) X nie jest zbiorem odpowiedzi bezpośrednich na żadne z pytań 
ze zbioru S, oraz (2) istnieje rekurencyjna własność P taka, że każdy element 
zbioru X posiada tę własność (por. [Wiśniewski 1995, s. 98]; por. też [Harrali 
1969, s. 160] i [Harrah 2002, s. 10-11]). 

W odróżnieniu od oryginalnego twierdzenia Harraha, w jego rozszerzonej 
wersji przyjmuje się, że w rozważanych językach mogą występować nie tylko 
pytania nieskończone (czyli takie, które posiadają przeliczalnie nieskończoną 
ilość odpowiedzi bezpośrednich), ale również pytania skończone. Ponadto teza 
tego twierdzenia mówi o istnieniu rekurencyjnych zbiorów zdań, które nie są 
zbiorami odpowiedzi na żadne pytanie (por. [Wiśniewski, Pogonowski 2010, 
s. 4-5]). 

Zanim przejdę do treści internującego mnie twierdzenia, wprowadzę — za 
autorami wspomnianego artykułu — pojęcia w-pytania oraz pytania efek¬ 
tywnego (por. [Wiśniewski, Pogonowski 2010, s. 5]). Pod pojęciem ui-pytania 
rozumiemy pytanie, którego zbiór odpowiedzi bezpośrednich jest przeliczalnie 
nieskończonym zbiorem zdań. Pytanie jest efektywne wtedy i tylko wtedy, gdy 
zbiór jego wszystkich odpowiedzi bezpośrednich jest niepusty i rekurencyjnie 
przeliczalny. 

Interesujące mnie twierdzenie ma następującą postać: 

Twierdzenie 2. [Wiśniewski, Pogonowski 2010] Niech L będzie językiem, ta¬ 
kim że: (a) pośród jego wyrażeń znajdują się zdania i pytania, (b) zarówno 
zdania jak i pytania tego języka mogą zostać zakodowane przy użyciu liczb 
naturalnych, oraz (c) zbiór zdań języka L jest przeliczalnie nieskończony i re¬ 
kurencyjny. Jeżeli spełniony jest następujący warunek: 

(*) każdy (przeliczalnie) nieskończony rekurencyjny zbiór zdań języka L jest 
zbiorem odpowiedzi bezpośrednich na jakieś pytanie języka L 

to albo zbiór co-pytań nie jest rekurencyjnie przeliczalny, albo istnieje przy¬ 
najmniej jedno ui-pytanie języka L, które nie jest efektywne. 

W twierdzeniu tym mówi się zatem, że przy spełnieniu założonych wa¬ 
runków, w języku L możemy mieć do czynienia z jedną z dwóch możliwości. 
W przypadku pierwszej, zbiór w-pytań nie jest rekurencyjnie przeliczalny, 
co oznacza tyle, że nie istnieje mechaniczna metoda, która dla każdego py¬ 
tania należącego do zbioru w-pytań pozwalałaby rozstrzygnąć, że jest tak 
właśnie. W przypadku drugim istnieje co najmniej jedno pytanie języka, któ¬ 
rego zbiór odpowiedzi bezpośrednich jest przeliczalnie nieskończonym zbio¬ 
rem zdań, jednakże zbiór ten nie jest rekurencyjnie przeliczalny. 

Dowód Twierdzenia 2 zainteresowany Czytelnik znajdzie w przytaczanej 
już pracy [Wiśniewski, Pogonowski 2010]. 
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Przyjmuję, że język, w którym toczy się dialog maszyny i sędziego, speł¬ 
nia założenia powyższego twierdzenia. Ponadto przyjmuję, że zbiór w-pytań 
tego języka jest rekurencyjnie przeliczalny. Są to założenia silne, ale dzięki 
nim możliwe jest zagwarantowanie tego, że gracz poddawany testowi będzie 
dysponował dużymi możliwościami. Spełniający powyższe założenia język, 
w którym toczy się dialog maszyny i sędziego, będę oznaczał symbolem L*. 

O graczu-maszynie zakładam, co następuje: 

1. Dysponuje ona efektywną procedurą Ą rozpoznawania, czy wyraże¬ 
nie aktualnie dane na „wejściu” jest zdaniem języka L* , tj. — mówiąc 
intuicyjnie — procedura Pi zastosowana do dowolnego zdania języka 
L* danego na „wejściu” pozwala maszynie rozpoznać, w skończonej licz¬ 
bie z góry danych kroków, że jest to zdanie języka L* , natomiast Pi 
zastosowana do każdego danego na „wejściu” wyrażenia, które nie jest 
zdaniem języka L* , pozwala maszynie rozpoznać, znów w skończonej 
liczbie z góry danych kroków, że nie jest to zdanie języka L*. Oczywi¬ 
ście taka procedura może istnieć tylko wówczas, gdy zbiór zdań języka 
L* jest rekurencyjny. 

2. Dysponuje ona efektywną procedurą P 2 rozpoznawania, że wyrażenie 
aktualnie dane na „wejściu” i będące w-pytaniem języka L* , jest pyta¬ 
niem języka L*. I znów, taka procedura może istnieć tylko wówczas, gdy 
zbiór pytań języka L* jest rekurencyjnie przeliczalny. 

3. Dysponuje ona, dla pewnych pytań języka L*, poprawnymi oraz efektyw¬ 
nymi i zupełnymi procedurami generowania odpowiedzi bezpośrednich 
na te pytania. Procedura poprawna — to generująca na „wyjściu” zdania 
faktycznie będące odpowiedziami bezpośrednimi na rozważane pytanie 
i tylko takie zdania. Procedura efektywna — to procedura realizowana, 
dla każdej odpowiedzi bezpośredniej danej na „wyjściu”, w skończonej 
liczbie z góry danych kroków. Procedura zupełna — to procedura ge¬ 
nerująca, dla każdego zdania będącego odpowiedzią bezpośrednią, to 
zdanie (jeśli procedura jest zupełna, to mamy gwarancję, że każda od¬ 
powiedź bezpośrednia może być wygenerowana). Wyposażenie maszyny 
w takie procedury jest, rzecz jasna, możliwe tylko wówczas, gdy zbiory 
odpowiedzi bezpośrednich na pewne pytania języka L* (ściślej: na te 
pytania, których dotyczą te procedury) są rekurencyjnie przeliczalne. 

Wróćmy teraz do Twierdzenia 2. Ponieważ założyłem, że język, w któ¬ 
rym toczy się dialog maszyny i sędziego, to język L* , na mocy Twierdze¬ 
nia 2 (uwzględniając odpowiednie charakterystyki dotyczące gracza-maszyny) 
wnoszę, że istnieje przynajmniej jedno w-pytanie języka L* , które nie jest 
efektywne. Znaczy to, że zbiór odpowiedzi bezpośrednich na to pytanie nie 
jest zbiorem wartości żadnej funkcji rekurencyjnej, czyli - mówiąc dokład¬ 
niej dla każdej funkcji rekurencyjnej / albo istnieje zdanie (ściślej, jego 
kod, przy ustalonym kodowaniu) będące wartością tej funkcji i nie będące 
zarazem odpowiedzią bezpośrednią na rozważane pytanie, albo też istnieje 
zdanie będące odpowiedzią bezpośrednią na analizowane pytanie i nie będące 
zarazem wartością funkcji /. Wynika stąd, że dla każdej funkcji rekurencyjnej 
f, której wartościami są wyłącznie odpowiedzi bezpośrednie na rozważane py- 
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tanie istnieje co najmniej jedna odpowiedź bezpośrednia na to pytanie, która 
nie jest wartością funkcji f. Określmy pytania o tej własności mianem „nie¬ 
dościgłych”. Na mocy Twierdzenia 2 co najmniej jedno pytanie języka L* jest 
niedościgłe. 

Jest oczywiste, że dla pytania niedościgłego nie istnieje procedura genero¬ 
wania odpowiedzi bezpośrednich na to pytanie, która jest zarazem poprawna 
oraz efektywna i zupełna. Tak więc nie jest możliwe wyposażenie gracza- 
-maszyny, prowadzącego dialog z sędzią w języku spełniającym warunki na¬ 
kładane na język L *, w zestaw poprawnych oraz efektywnych i zupełnych 
procedur generowania odpowiedzi bezpośrednich na wszystkie pytania tego 
języka. W przypadku pytań „niedościgłych” zaimplementowane procedury 
mogą być jednak poprawne i efektywne, ale — co należy podkreślić — żadna 
z nich nie będzie zupełna (nie będziemy mieli więc gwarancji, że każda odpo¬ 
wiedź bezpośrednia może zostać wygenerowana). Co więcej, jest teoretycznie 
możliwe, że gracz-maszyna będzie wyposażony w wiele poprawnych i efek¬ 
tywnych procedur generowania odpowiedzi bezpośrednich na jakieś pytanie 
„niedościgłe” i procedury te dają w efekcie różne podzbiory właściwe zbioru 
odpowiedzi bezpośrednich na to pytanie. Nie można zatem a priori powie¬ 
dzieć, że istnieje jakaś odpowiedź bezpośrednia „absolutnie niedościgła”, tj. 
taka, która nie będzie generowana przez żadną poprawną i efektywną proce¬ 
durę. Jednakże żaden skończony zestaw procedur tego typu nie da w efekcie 
procedury zupełnej — albowiem taka dla pytania „niedościgłego” nie istnieje. 
Co więcej, chociaż można zawsze udoskonalać/rozbudowywać dostępne ma¬ 
szynie procedury, nie istnieje granica takich udoskonaleń, w której maszyna 
będzie dysponować skończonym i uniwersalnym zarazem zestawem procedur 
— tj. dla każdego pytania rozważanego języka co najmniej jedną poprawną, 
efektywną i zupełną procedurą generowania odpowiedzi bezpośrednich na to 
pytanie. 

Aby wzmocnić pozycję gracza-maszyny w TT można dodatkowo przyjąć 
następujące założenie: 

4. Dla każdego pytania języka L* gracz-maszyna dysponuje jakąś po¬ 
prawną i efektywną procedurą generowania odpowiedzi bezpośrednich 
na to pytanie. 

Powyższe założenie wyklucza sytuację, w której gracz-maszyna nie potrafi 
wygenerować żadnej odpowiedzi bezpośredniej na jakieś pytanie. 

Jakie są konsekwencje przyjętych założeń oraz ustaleń poczynionych na 
bazie Twierdzenia 2 dla zagadnienia adekwatności TT? 

Należy pamiętać, że „odpowiedź bezpośrednia” to nie to samo, co „od¬ 
powiedź trafna z uwagi na warunki zadania”. W TT oczekujemy, że gracz 
poddawany testowi powinien udzielać tych spośród odpowiedzi bezpośrednich 
na zadawane mu pytania, które są trafne z uwagi na warunki stawianych 
przed nim zadań. Aby udzielić odpowiedzi bezpośredniej, która spełnia ten 
warunek, gracz nie musi uprzednio wygenerować wszystkich odpowiedzi bez¬ 
pośrednich na to pytanie — wystarczy, aby był on w stanie wygenerować tę 
z nich, która jest trafna z uwagi na warunki zadania (i zarazem oczekiwana 
przez sędziego). Dotyczy to zarówno gracza-maszyny, jak i gracza-człowieka. 
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Zadanie graczowi-maszynie pytania niedościgłego nie musi prowadzić do tego, 
że sędzia nie otrzyma na to pytanie oczekiwanej odpowiedzi i tym samym 
trafnie zidentyfikuje gracza jako maszynę właśnie. Zdarzyć się może, że sę¬ 
dzia zada graczowi pytanie niedościgłe (nawet bez świadomości, że jest ono 
niedościgłe) i akurat ta odpowiedź bezpośrednia na to pytanie, która jest — 
z punktu widzenia sędziego i z uwagi na warunki zadania — trafna znajduje 
się wśród odpowiedzi, które mogą być efektywnie generowane przez maszynę z 
uwagi na dostępne jej procedury oraz zarazem wyprowadzone przez maszynę 
z jej „bazy wiedzy”. Wtedy sędzia otrzyma oczekiwaną odpowiedź, chociaż 
zadane przez niego pytanie było „niedościgłe”. Jednakże — w świetle poczy¬ 
nionych wyżej ustaleń - nie ma na to gwarancji. Rzecz w tym, że dla każdej 
odpowiedzi bezpośredniej na pytanie można tak dobrać warunki zadania, aby 
właśnie ta odpowiedź była trafna z uwagi na dobrane warunki zadania — 
a więc także dla takiej odpowiedzi, która nie może być wygenerowana za 
pomocą procedur dostępnych graczowi-maszynie (istnienie takich odpowie¬ 
dzi jest, przypomnijmy, zagwarantowane przez poczynione wyżej założenia 
i ustalenia). Jednakże w TT to sędzia ustala warunki zadania oraz zadaje 
pytania. Ta asymetria, wraz z poczynionymi wyżej ustaleniami, zdaje się po¬ 
ciągać następujący wniosek: chociaż jest możliwe, że gracz-maszyna odniesie 
sukces w TT przeprowadzanym w ustalonym przedziale czasowym, to za¬ 
wsze możliwe jest takie przedłużenie przeprowadzanego właśnie testu, w któ¬ 
rym gracz-maszyna odniesie porażkę, tj. sędzia trafnie zidentyfikuje gracza- 
- maszynę jako maszynę właśnie. Tak więc w dostatecznie długim przedziale 
czasowym po przeprowadzeniu dostatecznej liczby rund (por. rozdział 3.1) 
— to sędzia testujący gracza-maszynę odniesie sukces, a gracz-maszyna — 
porażkę. 

Test Turinga umożliwia zatem sędziemu dokonanie trafnej identyfikacji 
gracza-maszyny. Okazuje się jednak, że pod pojęciem gracza-maszyny tak 
naprawdę kryje się dowolny system poznawczy korzystający w teście Turinga 
wyłącznie z metod algorytmicznych (w rozumieniu przyjętym w tych rozwa¬ 
żaniach). Skoro tak, to może to być zarówno sztuczny system poznawczy, 
jak i naturalny system poznawczy, np. człowiek. W tym kontekście traci sens 
bardzo rozpowszechniony sposób mówienia o TT jako o teście odróżniającym 
ludzi od maszyn. Należałoby raczej mówić, że TT jest adekwatny jako na¬ 
rzędzie, które umożliwia odróżnianie systemów poznawczych (podkreślmy to 
jeszcze raz: bez rozróżniania na systemy sztuczne i naturalne) posługujących 
się wyłącznie metodami algorytmicznymi od tych, które korzystają z metod 
wykraczających poza algorytmy. Warto również zauważyć, że wspomniana 
adekwatność testu Turinga nie była — jak się wydaje — głównym celem, dla 
jakiego zaprojektowany został test. Celem tym było przecież zaprojektowanie 
testu, który pozwalałby na badanie obecności inteligencji w sztucznych syste¬ 
mach poznawczych (por. dwie tezy testu Turinga wg R. Frencha — strona 31). 
W kontekście Twierdzenia 2 rodzi się pytanie, czy TT jest dobrym narzędziem 
dla tak zaprojektowanego celu? (Oczywiście należy mieć na uwadze, że pyta¬ 
nie to ma sens w granicach ściśle zarysowanych założeń i ustaleń przyjętych 
powyżej). Okazuje się bowiem, że — przy spełnieniu pewnych warunków 
gracz-maszyna zawsze może zostać rozpoznany jako maszyna właśnie, prze- 


2.4. Twierdzenie Harraha w kontekście TT 


53 


grywając tym samym grę w naśladownictwo. W teoretycznej perspektywie 
stawia to na równi maszyny, o których intuicyjnie orzeklibyśmy, że wykazują 
wiele inteligentnych zachowań oraz te, o których orzeklibyśmy, że wykazują 
minimalną liczbę takich zachowań. Jeśli jednak wyobrażamy sobie praktyczne 
przeprowadzanie testu Turinga, to wydaje się, że wspomniane różnice doty¬ 
czące graczy-maszyn mogłyby jednak zostać dostrzeżone (pewne wyobrażenia 
na ten temat daje nam przeprowadzany regularnie konkurs Loebnera). 

Twierdzenie 2, rozważane w kontekście testu Turinga, ma pewne kłopo¬ 
tliwe konsekwencje. Po pierwsze, nie sposób a priori określić interwalu czaso¬ 
wego, w którym sędzia odniesie sukces, trafnie identyfikując gracza-maszynę 
jako maszynę właśnie. Po drugie — i ważniejsze! — nie sposób określić mo¬ 
mentu, w którym sędzia testujący gracza-człowieka powinien zakończyć test, 
zasadnie identyfikując gracza jako człowieka właśnie. Sędzia otrzymujący wy¬ 
łącznie oczekiwane odpowiedzi może zawsze przypuszczać, że ma po prostu do 
czynienia z maszyną, której procedury umożliwiają generowanie odpowiedzi 
trafnych z uwagi na warunki stawianych przez niego zadań, jako że pytanie, 
na które trafna (z uwagi na warunki zadania) odpowiedź bezpośrednia nie 
może zostać wygenerowana przez maszynę nie zostało jeszcze zadane. 

Twierdzenie 2 wydaje się mieć również pewne konsekwencje dla grupy 
argumentów, które określiłem jako argumenty z zupełnego systemu konwer- 
sacyjnego (por. rozdział 2.2). Przypomnijmy, że ten typ argumentacji spro¬ 
wadza się do wykazania, że nawet jeśli maszyna zdałaby test Turinga, to i tak 
nie moglibyśmy powiedzieć o niej, że jest inteligentna, ponieważ TT dostar¬ 
cza z gruntu błędnego kryterium posiadania inteligencji. Błock, Lem i Searle 
opisują (hipotetyczne) sztuczne systemy poznawcze, które, opierając się wy¬ 
łącznie na zaimplementowanych w nich algorytmach, mogą osiągnąć sukces 
w TT, rozumiany jako udzielanie sędziemu wyłącznie trafnych (z uwagi na 
warunki zadania ustalane przez sędziego) odpowiedzi bezpośrednich na za¬ 
dawane tym systemom pytania. W propozycji Błocka podstawą działania 
odpowiednich algorytmów jest drzewo konwersacji (por. rysunek 2.1), ko¬ 
smiczny gramofon Lema działa w oparciu o zasady określające, kiedy użyć 
jakiej płyty (por. rozdział 2.2.1), zaś w chińskim pokoju algorytmy określane 
są poprzez książkę przekładu (por. rozdział 2.2.2). Jedynie N. Błock szki¬ 
cuje bardziej szczegółowo metodę „pozyskiwania” odpowiednich algorytmów, 
pozostali wymienieni badacze po prostu przyjmują, że one istnieją (co jest 
krokiem dopuszczalnym, jako że mamy tu do czynienia z eksperymentami my¬ 
ślowymi). Teza o istnieniu algorytmu czy algorytmów, którego/których dzia¬ 
łanie umożliwi, dla każdego pytania, jakie może zadać sędzia, i dla każdych 
warunków zadania ustanowionych przez sędziego dla tego pytania, udzielanie 
wyłącznie trafnej — z uwagi na warunki zadania — odpowiedzi bezpośred¬ 
niej na to pytanie, zdaje się pełnić kluczową rolę w dowolnym z argumentów 
z zupełnego systemu kowersacyjnego. Twierdzenie 2 wprowadza tu jednak 
pewne wątpliwości dotyczące możliwości istnienia takiego algorytmu. Oczy¬ 
wiście bezpośrednie zastosowanie rozważanego twierdzenia w tym kontekście 
nie jest możliwe. W omawianych eksperymentach myślowych nie możemy bo¬ 
wiem wprost mówić o prostym systemie pytań i odpowiedzi (tak jak w przy¬ 
padku zrekonstruowanego w tej pracy testu Turinga). Przykłady podawane 


54 


2. Spory i dyskusje wokół testu Turinga 


przez N. Błocka, S. Lema czy J. Searle’a sugerują, że należałoby tutaj mówić 
raczej o odpowiednich reakcjach werbalnych na wypowiedzi pytającego. Co 
istotne, wydaje się jednak, że nawet w takiej sytuacji, hipotetyczne sztuczne 
systemy poznawcze rozpatrywane w argumentach z zupełnego systemu kon- 
wersacyjnego powinny jak się wydaje — - posiadać własności epistemiczno- 
-pragmatyczne omówione w kontekście rozważań poświęconych konsekwen¬ 
cjom Twierdzenia 2 dla testu Turinga (por. s. 50). 


Rozdział 3 


Test Turinga — perspektywa sędziego 


W niniejszym rozdziale spróbuję spojrzeć na test Turinga z perspektywy 
sędziego. Taka perspektywa jest, moim zdaniem, bardzo ważna dla analizy 
testu Turinga. Wskazują na to uwagi dotyczące roli sędziego w teście poczy¬ 
nione przez samego Turinga, a także trafne obserwacje N. Błocka dotyczące 
tego zagadnienia (por. rozdział 1). Niestety, tego typu rozważania nie są zbyt 
rozpowszechnione w literaturze przedmiotu. Warto wspomnieć tutaj o pracy 
„Undecidability in tlie Imitation Gamę” [Sato, Ikegami 2004]. Głównym ce¬ 
lem autorów tego artykułu jest analiza roli i możliwości sędziego w teście 
Turinga. Przyjmują oni jednak dość zaskakująco — że sędzia będzie mo¬ 
delowany przez maszynę (konkretnie przez maszynę Turinga). Sprawia to, że 
wynik otrzymany przez autorów tego artykułu jedynie pośrednio odnosi się 
do oryginalnej propozycji testu Turinga. 

W tym rozdziale poruszone zostaną dwie kwestie związane z perspektywą 
sędziego: znaczenie doboru sędziego w teście Turinga oraz problem istnie¬ 
nia optymalnej strategii postępowania dla sędziego, dzięki której mógłby on 
dokonać trafnej identyfikacji gracza w TT. 

W sprawie doboru sędziego wypowiada się już sam Turing w „Compu- 
ting machinery..Pisze, że powinien to być „przeciętny pytający” (average 
interrogator ) [Turing 1950, s. 442]. Z kolei, w wywiadzie dla BBC z roku 
1952 podkreśla, że nie powinna to być osoba, która „jest ekspertem w spra¬ 
wie komputerów” [Newman et al. 1952, s. 4[. Alan Turing doskonale zdawał 
sobie sprawę z tego, że wiedza, którą posiada sędzia może rzutować na po¬ 
dejmowane przez owego sędziego decyzje. Dlatego właśnie wprowadza takie 
ograniczenie. Należy pamiętać, że jedno z założeń leżących u podstaw TT 
głosi, że rozmowa pomiędzy sędzią a uczestnikiem testu powinna przebiegać 
jak najbardziej naturalnie (tak, jak toczone są nasze codzienne rozmowy). 
Poruszaną kwestię podejmuje również N. Błock w swoim artykule „The Mind 
as the Software of the Brain”. Przypomnijmy tu — cytowany już w pierwszym 
rozdziale tej książki — odpowiedni fragment: 

Sędzia, który byłby wybitnym autorytetem w sprawie rzeczywiście inteligentnych ma¬ 
szyn, wiedziałby w jaki sposób odróżnić je od ludzi. Przykładowo, taki ekspert może 
wiedzieć, że obecne inteligentne maszyny radzą sobie z pewnymi problemami kłopotli¬ 
wymi dla ludzi [Błock 19956, s. 379]. 
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Dalej czytamy: 

Ludzi, którzy nie są zbyt obeznani z komputerami można zadziwiająco łatwo oszukać 

[...] [Błock 19956, s. 379]. 

Z przytoczonych fragmentów można wnioskować, że zarówno Turing, jak 
i Błock zdawali sobie sprawę z tego, że dobór sędziego może wpłynąć na 
ostateczny wynik testu Turinga. 

Problem doboru sędziego jawi się jako szczególnie istotny w kontekście 
konkursu Loebnera. Już sama formuła konkursu, w którym zwycięzca otrzy¬ 
muje nagrodę pieniężną, sprawia, że poruszane tutaj zagadnienie wysuwa się 
na pierwszy plan. Co więcej, sami programiści, którzy biorą udział w konkur¬ 
sie Loebnera przyznają, że pewne stosowane przez nich rozwiązania opierają 
się właśnie na wiedzy o tym, kto będzie sędzią w danej edycji konkursu (por. 
[Mauldin 1994], [Garner 2009], [Humphrys 2009]). 

Interesujący jest również fakt, że sama sytuacja konkursu nastawia sę¬ 
dziów bardziej podejrzliwie wobec uczestników. Można to zauważyć na przy¬ 
kładzie programu ChatterBot autorstwa M. Mauldina. Program zgłoszony 
został do konkursu Loebnera w 1993 roku, ale nie osiągnął w nim szczególnie 
wysokich wyników. Mauldin postanowił jednak sprawdzić, jak jego program 
poradzi sobie w grze TinyMUD (stworzonej przez J. Aspnesa). TinyMUD 
jest przygodową sieciową grą tekstową, w której uczestniczą gracze z całego 
świata. ChatterBot udawał jednego z takich graczy. Analiza zapisanych 
logów rozmów wskazuje na to, że program ten radził sobie znacznie lepiej 
niż w konkursie Loebnera. Warto tutaj podkreślić, że żaden z graczy-ludzi 
nie spodziewał się, że którakolwiek z napotkanych w wirtualnym świecie po¬ 
staci nie będzie człowiekiem. M. Mauldin sugeruje, że być może taka forma 
testowania programów dialogowych (określa ją mianem unsuspecting Turing 
test) jest znacznie bardziej trafna niż ta wyznaczana przez ramy konkursu 
Loebnera. 

O problemach, z jakimi borykają się organizatorzy konkursu Loebnera 
pisze szeroko Hugh Loebner (pomysłodawca konkursu) w artykule „How to 
Hołd Turing Test Contest” [Loebner 2009]. Nieco dziwne wydaje się sugero¬ 
wane przez Loebnera rozwiązanie poruszanej przez nas kwestii - poleca on, 
aby na sędziów wybierać dziennikarzy. Jego zdaniem bowiem, to oni najle¬ 
piej nadają się do tej roli ze względu na swoją „inteligencję i dociekliwość” 
(por. [Loebner 2009]). Pomysł ten zrealizowano w 1993 roku. Spotkał się on 
jednak z krytycznymi glosami ze strony programistów biorących udział w tej 
edycji konkursu (por. [Garner 2009] [Mauldin 1994]). R. Garner [2009] propo¬ 
nuje, aby sędziowie stanowili reprezentatywną próbkę całego społeczeństwa. 
Jego zdaniem zapewni to bardziej wiarygodne wyniki w konkursie Loebnera. 
Wspomniany artykuł R. Garnera jest jednak ciekawy przede wszystkim ze 
względu na swój główny temat. Autor opisuje w nim aplikację o nazwie Tu¬ 
ring Hub. Jej głównym zadaniem jest pośredniczenie pomiędzy uczestnikami 
konkursu Loebnera a sędziami. Celem rozwoju tej aplikacji jest wypracowa¬ 
nie i implementacja standardowego interfejsu dla przeprowadzania konkursu 
Loebnera. Ów interfejs uniemożliwia stosowanie pewnych sztuczek programi¬ 
stycznych, które pozwoliłyby na oszukanie sędziego. Turing Hub ujednolica 
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format tekstu wpisywanego przez uczestników konkursu (zarówno maszyny, 
jak i ludzi), dzięki czemu sędziowie koncentrują się na treści otrzymywanych 
wypowiedzi, a nie na ich formie graficznej, sposobie, w jaki się pojawiają na 
monitorze itp. 

W podobnym kierunku — choć już na znacznie wyższym poziomie ogólno¬ 
ści — zmierza S. Watt w artykule „Can People Think? Or Machines? A Uni- 
fied Protocol for Turing Test” [Watt 2009]. Autor proponuje w nim szkic 
uniwersalnego protokołu, wedle którego sędzia powinien przeprowadzać test 
Turinga. Przy konstrukcji tego protokołu Watt opierał się z jednej strony 
na badaniach bibliograficznych, z drugiej zaś na wynikach sondażu, który 
przeprowadził na potrzeby wspomnianej publikacji. Celem tych ustaleń było 
opracowanie skali cech, które mogą świadczyć o obecności inteligencji u da¬ 
nego podmiotu poznawczego (najwyżej w skali znalazły się autonomiczność, 
responsywność, zorientowanie na cel oraz komunikatywność — por. [Watt 
2009, s. 309]). Niestety na podstawie samego tylko artykułu nie można zwe¬ 
ryfikować metodologicznej wartości przedstawionych wyników (S. Watt nie 
podaje bowiem wielu niezbędnych do tego celu szczegółów zastosowanych 
procedur badawczych). Sam autor traktuje je jednak jako formę wstępnego 
szkicu i propozycję do dalszych rozważań. Protokół dla TT zawiera 14 pytań- 
-wskazówek dla sędziego, na podstawie których może on formułować pytania 
do gracza. Są to m.in. następujące pytania (por. [Watt 2009, s. 315]): 

Czy uczestnik udziela odpowiedzi w czasie rzeczywistym? 

Czy uczestnik wykazuje się znajomością wiedzy potocznej (zdroworoz¬ 
sądkowej)? 

— Czy uczestnik jest w stanie okazywać emocje? 

- Czy uczestnik przypisuje innym posiadanie stanów mentalnych? 

Dodatkowo protokół reguluje czas trwania TT, sposób komunikacji uczest¬ 
nika z sędzią, a także pewne kwestie dotyczące samego sędziego (np. czy 
może on powoływać jako doradcę eksperta do spraw komputerów, aby ziden¬ 
tyfikował on strategie wykorzystywane przez uczestnika testu). Propozycja 
S. Watta — choć znajduje się na wczesnym etapie opracowywania — wy¬ 
daje się ciekawym rozwiązaniem problemu doboru sędziego (a także krokiem 
w kierunku ustalenia dla niego strategii postępowania - - por. np. rozdział 
3.1). Jeżeli udałoby się opracować zestandaryzowany protokół przeprowadza¬ 
nia testu Turinga, to wpływ doboru sędziego na wynik TT zostałby zmini¬ 
malizowany. Środek ciężkości tego problemu zostałby przeniesiony na metodę 
doboru pytań do takiego protokołu. 

Obydwa opisane powyżej teksty zostały opublikowane w książce Parsing 
the Turing Test [Epstein et al. 2009], w części o bardzo znaczącym — w tym 
kontekście — tytule: „The New Methodological Debate”. Rzeczywiście wydaje 
się, że wyznaczają one nową jakość w dyskusjach nad testem Turinga. 

Zagadnienie strategii, jaką może stosować uczestnik TT, jest często po¬ 
ruszane w literaturze przedmiotu. Już sam Turing nakłada tutaj określone 
warunki opisane szczegółowo w rozdziale pierwszym niniejszej książki. Natu¬ 
ralne jest również to, że rozważania dotyczące tej kwestii pojawiają się często¬ 
kroć w tekstach autorów przygotowujących programy do udziału w konkursie 
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Loebnera. Zastanawiające jest to, że zagadnienie istnienia strategii dla sę¬ 
dziego jest niemalże nieobecne we wspomnianej literaturze. Pytanie, w jaki 
sposób sędzia mógłby sobie zapewnić, że dokona trafnej identyfikacji gracza 
w TT wydaje się - moim zdaniem — ze wszech miar ciekawe. 

Próby odpowiedzi na nie spróbuję udzielić, korzystając z formalnego mo¬ 
delu TT sformułowanego w ramach inferencyjnej logiki pytań (Inferential 
Erotetic Logic — IEL) autorstwa A. Wiśniewskiego. 


3.1. Próba formalnego ujęcia testu Turinga 


Próby skonstruowania formalnego modelu testu Turinga lub choćby za¬ 
stosowania pewnych narzędzi formalnych do jego zbadania nie są zbyt popu¬ 
larne w literaturze przedmiotu. W tym kontekście możemy wymienić artykuł 
[Sato, Ikegami 2004], w którym autorzy starają się przedstawić konsekwen¬ 
cje ograniczeń maszyn Turinga dla testu Turinga. Warto również wspomnieć 
tekst [Hernandez-Orallo 2000], w którym wykorzystuje się pewne osiągnięcia 
z dziedziny złożoności obliczeniowej dla zbadania testu Turinga jako testu 
posiadania inteligencji. Pełny formalny model testu Turinga — opierający 
się na teorii dowodów interakcyjnych - znajdziemy w [Bradford, Wollowski 
1995], [Shieber 2007], a także w [Shieber 2006]. W porównaniu z ilością fi¬ 
lozoficznej literatury na temat TT, sytuacja na polu formalizacji testu nie 
przedstawia się zbyt dobrze. Głównym powodem takiego stanu rzeczy jest — 
jak się wydaje — brak zgody co do rzeczywistych, oryginalnych założeń testu 
Turinga. 

Omówię tutaj propozycję modelu testu Turinga bazującą na pragmatycz¬ 
nej interpretacji pewnych narzędzi dostarczanych przez inferencyjną logikę 
pytań. Wykorzystanie w tym miejscu modelu formalnego zapewnia, moim 
zdaniem, większą precyzję rozważań. Oczywiście kosztem jest tutaj koniecz¬ 
ność poczynienia pewnych założeń początkowych wynikających z zastosowa¬ 
nych narzędzi formalnych. Wydaje się jednak, że pomimo tych ograniczeń 
udało się zachować intuicje związane z oryginalnym sformułowaniem testu 
Turinga. 

Przy rekonstrukcji oryginalnych założeń dotyczących testu Turinga (por. 
rozdział 1) zauważyłem, że na TT możemy patrzeć jako na system pytań i od¬ 
powiedzi. W teście bierze udział dwóch uczestników: poddawany testowi (A) 
oraz sędzia (pytający — C). Można metaforycznie powiedzieć, że to na bar¬ 
kach sędziego spoczywa przebieg testu, ponieważ to on decyduje, jakie pytania 
zadać i wyłącznie na podstawie odpowiedzi udzielonych przez A musi zadecy¬ 
dować czy A jest człowiekiem, czy maszyną. Ponadto — jeśli przyjrzymy się 
przykładom przebiegu TT podawanym przez Turinga — sposób zadawania 
pytań, ich sformułowanie i dobór wydają się kluczowe w TT. Spostrzeżenia 
te skłaniają do próby zbadania testu Turinga rozpatrywanego z perspektywy 
sędziego oraz strategii, jakie może on przyjmować podczas przeprowadzania 
testu. W tym celu posłużę się inferencyjną logiką pytań autorstwa A. Wi¬ 
śniewskiego. Główną motywacją wyboru właśnie tego aparatu formalnego jest 
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to, że inferencyjna logika pytań koncentruje się wokół zagadnienia rozumo¬ 
wań z wykorzystaniem pytań oraz warunków poprawności takich rozumowań. 
Jak zobaczymy w dalszej części niniejszego rozdziału, precyzyjne ujęcie tych 
zagadnień ma kapitalne znaczenie z perspektywy sędziego w teście Turinga. 
Pewne intuicje zaczerpnięte zostały również z matematycznej teorii gier oraz 
teorii dowodów interakcyjnych. Model przedstawiony poniżej nazwiemy dla 
uproszczenia TT iel- 


3.1.1. TT jako gra 

Przy formułowaniu TT iel wykorzystane zostaną następujące założenia 
dotyczące testu Turinga: 

1. W grze uczestniczy dwóch graczy: C, czyli pytający, oraz gracz A, pod¬ 
dawany testowi. 

2. A i C nie mogą się widzieć, słyszeć, pisać do siebie pismem odręcznym. 

3. To C zadaje pytania, zaś A na nie odpowiada. 

4. W pierwszej kolejności lepiej jest rozważać TT z pytaniami rozstrzyg¬ 
nięcia (por. [Turing 1950, s. 445] oraz rozdział 1). 

5. Celem gracza A jest wprowadzenie w błąd gracza C, tak żeby dokonał on 
niepoprawnej identyfikacji (por. [Turing 1950, s. 434]). A zobowiązany 
jest również do postępowania zgodnie ze strategią jak najwierniejszego 
naśladownictwa odpowiedzi, jakich udzieliłby człowiek na jego miejscu. 

6. Test ma charakter statystyczy i powinien być powtarzany kilkakrotnie 
(por. rozdział 1). 

Tak ujęty TT traktowali będziemy jako rodzaj gry, w której ścierają się 
interesy dwóch graczy. Nawiązujemy tym samym do pojęcia gry, obecnego 
w matematycznej teorii gier. Przyjmuje się w niej, że o grze możemy mówić 
wszędzie tam, gdzie [Straffin 2001, s. 1]: 

1. „Można wskazać co najmniej dwóch graczy. Graczem może być człowiek, 
ale także firma, państwo, czy nawet gatunek w znaczeniu biologicznym. 

2. Każdy gracz ma do wyboru pewną liczbę możliwych strategii , określa¬ 
jących sposób rozgrywania przez niego gry. 

3. Wynik gry jest determinowany przez kombinację strategii wybranych 
przez poszczególnych graczy. 

4. Każdemu możliwemu wynikowi gry odpowiada zestaw wypłat dla po¬ 
szczególnych graczy, których wysokość można wyrazić liczbowo”. 

W dalszej części tego rozdziału - wzorując się na teorii dowodów inter¬ 
akcyjnych (por. [Goldwasser et al. 1985], [Papadimitriou 2002]) — graczy 
w TT iel będę nazywał, odpowiednio, „dowodzicielem” ( prover — P) oraz 
„weryfikatorem” ( yerifier — V). Są oni odpowiednikami gracza A i C w ory¬ 
ginalnym sformułowaniu testu. Wykorzystanie innych oznaczeń motywowane 
jest tym, że lepiej oddają one intuicje związane z rolami graczy w TT niż 
tradycyjnie używane oznaczenia literowe A, C. Gracz P stara się przekonać 
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V co do prawdziwości sądu, że jest on człowiekiem a nie maszyną. Zada¬ 
niem V jest zweryfikowanie owego sądu. Możemy dookreślić, że TT modeluje 
sytuację czystego konfliktu, ponieważ nie ma tu mowy o kooperacji (współ¬ 
pracy) pomiędzy graczami. Każdy TT kończy się zwycięstwem jednego z gra¬ 
czy i przegraną drugiej strony. Sytuacja remisu nie jest tu możliwa, ponieważ 
TT kończy się każdorazowo werdyktem wydanym przez sędziego, w którym 
identyfikuje on gracza P albo jako maszynę albo jako człowieka. I tak: 

— P zwycięża, gdy V dokona nietrafnej identyfikacji. 

— V zwycięża, gdy dokona trafnej identyfikacji. 

Traktując TT jako pewnego rodzaju grę możemy przyjąć założenia doty¬ 
czące strategii graczy. Gracz P ma odpowiadać tak, jak odpowiadałby czło¬ 
wiek. Można powiedzieć, że P obowiązuje warunek „szczerości” (odpowiada¬ 
nia zgodnie z posiadaną przez siebie wiedzą). Przypomnijmy w tym miejscu 
cytowany już fragment „Computing Machinery...”: 

Niektórzy mogą argumentować, że najlepszą strategią dla maszyny podczas „gry w na¬ 
śladownictwo” mogłoby być coś innego niż naśladowanie zachowania człowieka. Być 
może tak jest, ale uważam, że jest mało prawdopodobne aby tego typu działania przy¬ 
niosły jakiś znaczący efekt [...] Zakładam, że najlepszą strategią w tej sytuacji jest 
udzielanie odpowiedzi takich, jakie w naturalny sposób udzielone zostałyby przez czło¬ 
wieka [Turing 1950, s. 435]. 

Gracz V zadający pytania dąży do identyfikacji gracza P. Wydaje się, iż 
naturalne jest tutaj przyjęcie założenia, że dobór pytań zadawanych przez 

V nie będzie przypadkowy, ale podlegał będzie pewnej strategii. Jej wybór 
uzależniony jest od dwóch czynników: wiedzy początkowej gracza V (czyli 
zasobu wiedzy sędziego, zbioru jego przekonań na temat tego, co to znaczy 
być człowiekiem etc.) oraz odpowiedzi udzielanych przez P w trakcie testu. 

Podsumowując, TT traktował będę jako grę składającą się ze skończonej 
liczby „rund”, gdzie na każdą rundę składa się pytanie zadane przez V i odpo¬ 
wiedź nań udzielona przez P. Po ostatniej rundzie V dokonuje identyfikacji, 
czyli uznaje bądź odrzuca twierdzenie zgłaszane przez P na początku gry 
(warto przypomnieć, że zgodnie z założeniami TT to V decyduje, kiedy za¬ 
kończyć grę). Ilustruje to rysunek 3.1. 


Jestem człowiekiem 



Rysunek 3.1. TT jako gra. Gracz P stara się przekonać V co do prawdziwości sądu, że 
jest on człowiekiem. Sędzia V w kolejnych rudach gromadzi dane, które pozwolą mu uznać 
ten sąd za prawdziwy lub fałszywy (co kończy grę) 
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W prezentowanym podejściu koncentruję się głównie na perspektywie V 
w teście Turinga. Traktuję tym samym gracza P jako swego rodzaju „czarną 
skrzynkę” udzielającą odpowiedzi. Moim zdaniem doskonale oddaje to intui¬ 
cje oryginalnej propozycji Turinga — nie jest istotne z jakich mechanizmów 
czy procedur korzysta P, to co się liczy, to wyłącznie odpowiedzi, których 
udziela. 

Zanim przejdę do omówienia proponowanego tutaj modelu testu Turinga, 
dokonam krótkiego wprowadzenia do wykorzystywanego w nim aparatu for¬ 
malnego. 


3.1.2. Inferencyjna logika pytań i scenariusze erotetyczne 

Na potrzeby niniejszej pracy zrezygnuję z bardzo szczegółowej, formalnej 
charakterystyki scenariuszy erotetycznych (w skrócie e-scenariuszy), ograni¬ 
czając się do podania jedynie niezbędnych definicji. Czytelnika zaintereso¬ 
wanego większą ilością szczegółów odsyłam do prac twórcy e-scenariuszy — 
Andrzeja Wiśniewskiego ([Wiśniewski 2001], [Wiśniewski 2003], [Wiśniewski 
2004]). 

Najogólniej rzecz ujmując, idea e-scenariuszy stanowi realizację tzw. za¬ 
sady dekompozycji ( Decomposition Principle — DP ). Zasadę tę - która 
wywodzi się z metody kartezjańskiej — możemy sformułować następująco: 

DP: Problem początkowy powinien zostać rozłożony na prostsze problemy cząstkowe, 

w taki sposób, żeby rozwiązania owych problemów cząstkowych mogły złożyć się na 

rozwiązanie problemu początkowego [Urbański, Wiśniewski 2006, s. 1], 

Wyobraźmy sobie, na przykład, że zastanawiamy się nad tym, czy jakiś 
system działa poprawnie. Załóżmy też, że wiemy, że systemy działają po¬ 
prawnie wtedy i tylko wtedy, gdy mają prawidłową architekturę i działają 
stabilnie. Jakie pytania powinniśmy zadać i w jakiej kolejności, aby uzyskać 
rozwiązanie naszego problemu tak szybko, jak to tylko możliwe? Rozwiązania 
dostarcza właśnie e-scenariusz. E-scenariusz możemy przedstawić w postaci 
drzewa, gdzie korzeniem jest pytanie początkowe, zaś liśćmi odpowiedzi bez¬ 
pośrednie na owo pytanie. Scenariusz dla naszego przykładowego problemu 
widoczny jest na rysunku 3.2. 

E-scenariusz z rysunku 3.2 można zapisać używając do tego sformalizowa¬ 
nego języka J (por. rysunek 3.3). Język J jest językiem klasycznego rachunku 
zdań (KRZ), którego słownik został rozszerzony o znaki: ?, {, }. Pojęcie for¬ 
muły zdaniowej rozumiane jest tutaj tak, jak w KRZ. Znaki p, q, r, s, t, u, 
pi, ... będą używane na oznaczenie zmiennych zdaniowych. Formuły zdaniowe 
języka J będą nazywane formułami deklaratywnymi języka J (jako metajęzy¬ 
kowych zmiennych dla formuł deklaratywnych użyte zostaną litery A, B, C , 
D, z ewentualnymi indeksami). Litery X, Y, Z (z ewentualnymi indeksami) 
będą wykorzystywane jako metajęzykowe zmienne dla oznaczenia zbiorów 
formuł deklaratywnych. Pytaniem języka J jest wyrażenie o postaci: 


?{Ai,A 2 , ..., A n } 
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Czy ten system S działa poprawnie? 

S działa poprawnie wtw ma prawidłową 
architekturę oraz jest stabilny. 

S jest stabilny wtw pomyślnie przeszedł testy. 

Czy S ma prawidłową architekturę oraz jest stablilny? 
Czy S ma prawidłową architekturę? 



S ma prawidłową architekturę 
Czy S jest stabilny? 

Czy S pomyślnie przeszedł testy? 


S pomyślnie przeszedł testy. 
S jest stabilny. 

S ma prawidłową 
architekturę i jest stabilny. 

S działa poprawnie. 



Nie jest tak, że S 
pomyślnie przeszedł testy. 
Nie jest tak, że S jest stabilny. 
Nie jest tak, że S 
ma prawidłową architekturę 
i jest stabilny. 

Nie jest tak, że S 
działa poprawnie. 


Nie jest tak, że S 
ma prawidłową architekturę. 

Nie jest tak, że S 
ma prawidłową architekturę 
i jest stabilny. 

Nie jest tak, że S 
działa poprawnie. 


Rysunek 3.2. E-scenariusz dla przykładowego problemu (wyjaśnienia w tekście) 


gdzie n > 1, zaś Ai, A2, ..., A n są różnymi od siebie formułami deklaratyw¬ 
nymi. Każda z formuł Ai,A 2, ■■■■,A n nazywana jest odpowiedzią bezpośrednią 
na pytanie o postaci ?{Ai> A2, ..., A n }. Pytanie takie można czytać: „Czy jest 
tak, że A\, lub czy jest tak, że A 2 , lub czy jest tak, że A n ?” Dla pew¬ 
nych typów pytań przyjmujemy nieco inną konwencję notacyjną. Pytania 
typu: ?{A, ~^A} („Czy jest tak, że AT') zapisywali będziemy jako: ?A Pytania 
o schemacie ?{AaB,AA-iB,-iAaB,—>AA-iB} (tzw. pytania koniunkcyjne) 
zapisywali będziemy skrótowo jako: ? ± |v4,i?|. Pytanie takie możemy czytać 
jako „Czy jest tak, że A i czy jest tak, że BT ’ (por. [Wiśniewski 2003, s. 399]) 1 . 


1 Uogólniona definicja pytań koniunkcyjnych ma następującą postać (por. [Urbański 
2001, s. 76]). Niech Ai,..., Ak (k > 1) będą różnymi od siebie formulami deklaratywnymi. 
Niech oś [j = 1, ...,k) będzie ciągiem składającym się z 2 k wyrazów, którego n-ty element 
definiowany jest w sposób następujący: 

( Aj jeżeli 1 < n < 

-'Aj jeżeli 2 k ~i <n< 2 ( - k ~^+ 1 

a n-m jeżeli 2^ k ~^ +1 < n < 2^,gdzie m = 2^ k ~A+ 1 
Niech /3'(1 < z < 2 k ) będzie k-elementowym ciągiem zdefiniowanym następująco: 

P'{ a \ i a i' 

Pytanie koniunkcyjne z jako czynnikami jest pytaniem o postaci: 

?{Ci,... ,Ct }, gdzie t = 2 k i każde Ci (i = 1, ma postać 

(tf A ($ A...(#_! A #)...). 

Pytanie takie będziemy skrótowo zapisywali jako ? ± \A\, 
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Łatwo zauważyć, że e-scenariusz składa się ze ścieżek prowadzących od 
pytania początkowego, poprzez pytania cząstkowe (i odpowiedzi na nie), aż 
do odpowiedzi na pytanie początkowe. 


■P 

p = q f\r 
r = s 
?(q A r) 
? ± \q,r\ 


q 

Ir 


M Ar) 

-*p 


q Ar -i(q A r ) 
P -'P 


Rysunek 3.3. E-scenariusz z rysunku 3.2 zapisany przy użyciu języka sformalizowanego 
J (opis języka w tekście) 


Jeśli użyjemy bogatszego języka, wzrosną również możliwości modelowa¬ 
nia pytań języka naturalnego. Jeśli np. wykorzystamy rachunek predykatów 
(dodając do niego wspomniane wcześniej stale erotetyczne), możemy wyrazić 
m. in. pytanie o to, czy dany obiekt posiada cechę, którą jesteśmy zaintereso¬ 
wani (jest to oczywiście tylko przykład z całej grupy tzw. pytań pierwszego 
rodzaju - por. [Wiśniewski 1990, s. 30]). E-scenariusz, który rozpoczyna się 
właśnie takim pytaniem, przedstawia rysunek 3.4. 


?Piu 

\/x{P\x = P 2 X A P$x) 
Vx(Pąx : P2x) 

? ± \P2U,P2,u\ 

1P 2 U 

7Pąu 



Rysunek 3.4. Przykład bardziej rozbudowanego e-scenariusza wyrażonego w bogatszym 
języku formalnym (opis w tekście). Pytanie początkowe tego e-scenariusza możemy zinter¬ 
pretować jako: „Czy obiekt u posiada własność Pi?” 
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?S(Pix) 

Vx(Pix = P%x) 

Vx(P2X ->l = #lVl = «2Vl = uz) 

Pz^z —> Pz u l v P2U2 

P 2 UZ 

P 3 U 1 = P 2 U 1 
?s (P 2 X) 

?{p 2 «l, P2U2, P2H3} 

?{P2«1> P 2 U 2 } 

?P 3 Ul 

Ą«1 -iP3Ui 
P2U1 P2U2 
PlUl P1U2 

Rysunek 3.5. Przykład bardziej rozbudowanego e-scenariusza wyrażonego w bogatszym 
języku formalnym (opis w tekście). Pytanie początkowe tego e-scenariusza możemy zinter¬ 
pretować jako: „Który spośród x-ów posiada własność Pi?” 


Dołączenie kolejnej stałej erotetycznej S - pozwala na wyrażenie pytań 
o postaci: 


?S (Ax il ,...x in ), gdzie n > 1 


W powyższej formule wyrażenie Axi 1 , ...Xi n reprezentuje dowolną funkcję 
zdaniową, której wszystkimi zmiennymi wolnymi są Xi 1 . ...Xi n (zakładamy, że 
zmienne Xj i; ...Xi n są różne między sobą). 

Odpowiedzi bezpośrednie na tego typu pytania przyjmują postać: 

A(x il /u 1 , ...,x in /u n ), 

gdzie ui,...,u n są termami domkniętymi podstawionymi odpowiednio za 
zmienne wolne 2 ^, ...,Xi n . Cechą charakterystyczną tego rodzaju pytań jest 
więc to, że są one pytaniami, w odpowiedzi na które należy wskazać przed¬ 
miot lub n-tkę przedmiotów spełniających daną funkcję zdaniową (por. 
[Wiśniewski 1990, s. 32]). I tak np. pytanie ?S(Pix) moglibyśmy odczytać 
jako: „Który spośród cc-ów posiada własność Pi?” Scenariusze erotetyczne, 
w których pytania początkowe są właśnie pytaniami tego typu, przedstawiają 
rysunki 3.5 i 3.6. 

Więcej szczegółów oraz konstrukcje pozwalające na wyrażanie innych py¬ 
tań języka naturalnego zainteresowany czytelnik znajdzie np. w [Wiśniewski 
1990] i [Wiśniewski 1995]. 

Kluczowe dla przedstawionych tutaj rozważań jest to, że dobór pytań poja¬ 
wiających się na każdej ze ścieżek e-scenariusza nie jest przypadkowy. Są one 
powiązane ze sobą przez relację implikowania erotetycznego (por. [Wiśniewski 
2003, s. 401]). W przypadku rozumowań erotetycznych relacja ta stanowi od¬ 
powiednik relacji wynikania dla formuł deklaratywnych (dostarczając kryte¬ 
rium poprawności rozumowań erotetycznych). 

Definicja 1. Pytanie Q implikuje pytanie Q\ ze względu na zbiór formuł 
deklaratywnych X (symbolicznie: Im(<5, X, Qi)) wtw: 
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1. dla każdej odpowiedzi bezpośredniej A na pytanie Q: ze zbioru X U {A} 
wynika wielownioskowo 2 zbiór odpowiedzi bezpośrednich na pytanie Q\ 
oraz 

2. dla każdej odpowiedzi bezpośredniej B na pytanie Q\ istnieje niepusty 
podzbiór właściwy Y zbioru odpowiedzi bezpośrednich na pytanie Q, taki 
że Y wynika wielownioskowo ze zbioru X U {B}. 


?S(Piz) 

Vx(P\x —> x = ui V x = ii 2 ) 
P 2 U 1 —> Pi Ul 
-.P 2 Ul —>■ P 1 U 2 
P 2 U 1 = P 3 U 1 A P 4 U 1 
?{Pimi,Piu 2 } 

?P 2 «l 

?(P3«l A P 4 U 1 ) 

? ± IP3U1 j P4U11 
P3U1 



-•P 3 U 1 

-.(P 3 U 1 A P 4 U 2 ) 
^P 2 ui 

P\U2 


P 3 U 1 

?P 4 ui 



P 4 UI —'PjUl 

P 3 U 1 A P 4 U 1 -'(P 3 U 1 A P 4 U 2 ) 
P 2 ui -'P2U1 

Piui P 1 U 2 


Rysunek 3.6. Przykład bardziej rozbudowanego e-scenariusza wyrażonego w bogatszym 
języku formalnym (opis w tekście). Pytanie początkowe tego e-scenariusza możemy zinter¬ 
pretować jako: „Który spośród x-ów posiada własność Pi?” 

Warunek pierwszy powyższej definicji gwarantuje transmisję tzw. trafności 
pytań. Mówimy, że pytanie Q jest trafne wtedy i tylko wtedy, gdy co najmniej 
jedna odpowiedź bezpośrednia na to pytanie jest prawdziwa 3 . Intuicje zwią- 


2 W przypadku języka opartego na KRZ powiemy, że zbiór formuł deklaratywnych 
Y wynika wielownioskowo ze zbioru formuł deklaratywnych X wtw dla każdego wartościo¬ 
wania u, przy którym prawdziwe są wszystkie formuły należące do zbioru X , prawdziwa 
jest przynajmniej jedna formuła ze zbioru Y. 

Gdy rozważamy język oparty na klasycznym rachunku predykatów, dla którego w kla¬ 
sie wszystkich interpretacji (części deklaratywnej) została wyróżniona niepusta podklasa 
(niekoniecznie właściwa) interpretacji standardowych, zbiór formuł deklaratywnych Y wy¬ 
nika wielownioskowo ze zbioru formuł deklaratywnych X wtw co najmniej jedna formuła 
ze zbioru Y jest prawdziwa przy każdej interpretacji standardowej (części deklaratywnej 
rozważanego języka), która jest modelem zbioru X. 

Ogólna intuicja związana z wynikaniem wielownioskowym jest następująca: Y wynika 
wielownioskowo z X wtw co najmniej jedna formuła w Y musi być prawdziwa jeśli tylko 
wszystkie formuły w X są prawdziwe. 

W sprawie wynikania wielownioskowego zob. [Shoesmith, Smiley 1978]. 

3 Gdy rozważamy języki sformalizowane, pojęcie trafności ulega odpowiedniej relatywi¬ 
zacji. I tak, przykładowo, w przypadku języka, którego formułami deklaratywnymi są for¬ 
muły KRZ, zrelatywizujemy trafność do wartościowania (zbioru formuł deklaratywnych). 
Definicja przyjmie postać następującą: Pytanie Q jest trafne przy wartościowaniu v (w skro- 
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zane z warunkiem drugim są następujące: każda z odpowiedzi bezpośrednich 
na pytanie Qi powinna w jakiś sposób zawężać klasę możliwości oferowanych 
początkowo przez cały zbiór odpowiedzi bezpośrednich na Q. 

Dysponując definicją implikacji erotetycznej możemy teraz uszczegółowić 
intuicje związane z wyprowadzaniem odpowiedzi bezpośredniej na pewne py¬ 
tanie. Takie wyprowadzenie nazywane jest derywacją erotetyczną (w skrócie 
e-derywacją). Pojęcie e-derywacji pozwala również na doprecyzowanie tego, 
jak zbudowane są ścieżki składające się na e-scenariusz. 

Mówiąc dalej o formułach poprawnie zbudowanych, będę miał na myśli 
formuły deklaratywne oraz pytania rozważanego języka. 

Definicja 2. Skończony ciąg poprawnie zbudowanych formuł e = 
jest derywacją erotetyczną odpowiedzi bezpośredniej A na pytanie Q z uwagi 
na zbiór formuł deklaratywnych X wtedy i tylko wtedy, gdy ipi = Q, ip n = A 
i spełnione są następujące warunki: 

1. dla każdego pytania tfk ciągu e, takiego że k > 1: 

a. d Vk ^ dQ, oraz 

b. ipk+i jest albo pytaniem albo odpowiedzią bezpośrednią na ipki 

2. dla każdej formuły deklaratywnej ipj ciągu e 

a. ipj G X, lub 

b. ipj jest odpowiedzią bezpośrednią na <Pj~\, gdzie Pj-i ^ Q, lub 

c. (fj wynika z pewnego zbioru formuł deklaratywnych takiego, że 
każdy element tego zbioru poprzedza ipj w e; 

3. dla każdego pytania ipk ciągu e, takiego że ipk 7 ^ Q- Pk jest implikowane 
przez pewne pytanie ipj, które poprzedza pk w ciągu e z uwagi na zbiór 
pusty lub z uwagi na zbiór formuł deklaratywnych taki, że każdy element 
tego zbioru poprzedza (fk w ciągu e. 

Intuicyjnie możemy patrzeć na e-derywację jako na ciąg kroków prowadzą¬ 
cych od pytania do odpowiedzi na nie. Przy czym każdy kolejny krok musi 
być „legalny”. Pierwszy warunek definicji zapewnia, że pytania, które będą 
pojawiały się w e-derywacji po pytaniu początkowym nie będą z nim tożsame 
(innymi słowy, pytania te nie mogą mieć dokładnie takich samych zbiorów 
odpowiedzi bezpośrednich). Co więcej, formuła pojawiająca się w e-derywacji 
po pytaniu może być albo odpowiedzią bezpośrednią na to pytanie, albo kolej¬ 
nym pytaniem. Warunek drugi definicji określa, kiedy formuła deklaratywna 
może pojawić się w e-derywacji. Są trzy takie przypadki: kiedy formuła de¬ 
klaratywna należy do zbioru przesłanek początkowych e-derywacji (należy do 
zbioru formuł deklaratywnych, z uwagi na który konstruuje się e-derywację), 
gdy stanowi odpowiedź bezpośrednią na pytanie występujące w e-derywacji 
po pytaniu początkowym, lub kiedy wynika z pewnych formuł deklaratyw¬ 
nych występujących wcześniej w e-derywacji. Ostatni warunek mówi, że każde 


cie: jest u-trafne) wtedy i tylko wtedy, gdy przynajmniej jedna odpowiedź bezpośrednia na 
Q jest prawdziwa przy wartościowaniu v (por. [Wiśniewski 2003, s. 400]). 
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pytanie pojawiające się po pytaniu początkowym musi być implikowane ero- 
tetycznie przez poprzedzający go element (lub elementy) e-derywacji (por. 
[Wiśniewski 2003, s. 403]). 

Przypatrzmy się prostemu przykładowi e-derywacji dla pytania ?{p, q,r} 
z uwagi na zbiór formuł deklaratywnych X = (s V t, s —>■ p, t —> q V p). 
Poszczególne elementy e-derywacji oddzielone są od siebie średnikami: 

?{P, 9, ? ’}; sVi;s^p;i^gVr;?{s,i}; s;p. 

Wprowadzenie pytania 7{s,t} jest możliwe dzięki temu, że zachodzi 
Im(?{A, B,C},DW E,D ^ A,E ^ B\f C, ?{£>, E}). 

Z uwagi na dalsze rozważania poświęcone e-scenariuszom, ważnym po¬ 
jęciem związanym z e-derywacją jest pojęcie zapytania ( query ). Zapytanie 
możemy zdefiniować następująco: 

Definicja 3. Element ipk (gdzie 1 < k < ń) e-derywacji e = ipi,...,tp n 
jest zapytaniem ( query ) e-derywacji e, jeżeli ipk jest pytaniem oraz tpk +1 jest 
odpowiedzią bezpośrednią na ipk ■ 

I tak w powyższym przykładzie zapytaniem jest pytanie ?{s, £}. 

Dysponując definicjami implikacji erotetycznej oraz e-derywacji możemy 
przejść do podania definicji scenariusza erotetycznego, na który możemy spoj¬ 
rzeć jako na rodzinę e-derywacji. 

Definicja 4. Skończona rodzina ciągów poprawnie zbudowanych formuł 
jest scenariuszem erotetycznym dla pytania Q z uwagi na zbiór formuł dekla¬ 
ratywnych X wtedy i tylko wtedy, gdy każdy element jest e-derywacją odpo¬ 
wiedzi bezpośredniej na Q z uwagi na zbiór formuł deklaratywnych X i speł¬ 
nione są poniższe warunki: 

1. dQ nX = 0; 

2. zawiera przynajmniej dwa elementy; 

3. dla każdego elementu e = ip\, tp 2 ,..., tp n rodziny ciągów <P, dla każdego 
k, takiego, że 1 < k < n: 

a. jeżeli pk jest pytaniem oraz pk +1 jest odpowiedzią bezpośrednią na 

ipk, to dla każdej odpowiedzi bezpośredniej B na ipk rodzina ciągów 
d> zawiera pewną e-derywację e' = ■■■■,‘4’m taką, że ipj = ipj 

dla j = 1,..., k oraz ipk+i = B; 

b. jeżeli ipk jest formułą deklaratywną lub ifk jest pytaniem oraz ipk+i 
nie jest odpowiedzią bezpośrednią na <pk, to dla każdej e-derywacji 
e 1 = tfi, %l> 2 , •••) 'tpm w <P takiej, że ipj = ipj dla j = 1,..., fe mamy 
ipk- t-i = <Pk+ 1- 

E-scenariusze posiadają pewne ciekawe własności. Dwie z nich są szczegól¬ 
nie interesujące z perspektywy naszej pracy: pierwszą opisuje tzw. twierdzenie 
o złotej ścieżce ; drugą jest możliwość modyfikacji e-scenariusza dla danego 
pytania początkowego. W przypadku języków, których formułami deklara¬ 
tywnymi są formuły KRZ twierdzenie o złotej ścieżce ma następującą postać: 
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Twierdzenie 3. Twierdzenie o złotej ścieżce: Niech d> będzie e-scenariuszem 
dla pytania Q z uwagi na zbiór formuł deklaratywnych X. Niech v będzie 
takim wartościowaniem, że Q jest v-trafne i wszystkie formuły deklaratywne 
w X są prawdziwe przy wartościowaniu v. Wtedy scenariusz <d> zawiera przy¬ 
najmniej jedną ścieżkę e taką że: 

(a) każda formuła deklaratywna w e jest prawdziwa przy wartościowaniu v; 
oraz 

(b) każde pytanie w e jest v-trafne; oraz 

(c) e prowadzi do bezpośredniej odpowiedzi na Q, która jest prawdziwa przy 
wartościowaniu v [Wiśniewski 2003, s. 411]. 

Jeżeli początkowe pytanie e-scenariusza jest u-trafne oraz wszystkie prze¬ 
słanki początkowe są prawdziwe (przy wartościowaniu v), wtedy przynaj¬ 
mniej jedna ze ścieżek tego e-scenariusza prowadzi do prawdziwej (przy war¬ 
tościowaniu v) odpowiedzi bezpośredniej na pytanie początkowe. Ścieżka ta 
zawiera jedynie trafne pytania cząstkowe i prawdziwe zdania (pośród nich 
prawdziwe odpowiedzi na pytania cząstkowe). Można więc powiedzieć, że 
e-scenariusz nie tylko przedstawia plan poszukiwania odpowiedzi na pytanie 
początkowe, ale przedstawia „bezpieczny plan” poszukiwania tej odpowiedzi, 
który dodatkowo jest skończony, czyli poszukiwanie odpowiedzi kończy się 
w skończonej liczbie kroków (por. [Wiśniewski 2004, s. 151]). 


Q 

Q 

[X] 

[X U Y] 


Q i Q i 



Bi ... Bj ... B k 


Rysunek 3.7. Schemat operacji wklejania jednego e-scenariusza do drugiego (na podsta¬ 
wie [Wiśniewski 2008]) 


Jak zauważyłem powyżej, e-scenariusz przedstawia plan poszukiwania od¬ 
powiedzi na pytanie początkowe. Z perspektywy tych rozważań szczególnie 
istotne jest to, że ów plan może zostać poddany modyfikacjom poprzez wy¬ 
konanie prostych operacji na e-scenariuszach. Dzięki temu możliwe jest do¬ 
pasowanie takiego planu do zaistniałych potrzeb. Co istotne, po dokonaniu 
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wspomnianych operacji e-scenariusze zachowują wszystkie interesujące nas 
własności. Przyjrzyjmy się bliżej jednej z takich operacji — wklejaniu e- 
-scenariuszy (systematic embedding). Intuicyjnie mówiąc, możliwe jest wkle¬ 
jenie jednego e-scenariusza do drugiego, tak aby w efekcie otrzymać nowy 
e-scenariusz. Jeżeli na przykład mamy e-scenariusz ty dla pytania Q zbudo¬ 
wany ze względu na zbiór przesłanek X oraz zapytanie ( ąuery) Q* występu¬ 
jące na jednej ze ścieżek ty, a także e-scenariusz ty dla pytania Q* zbudowany 
w oparciu o zbiór przesłanek Y , to możemy wkleić ty do ty (oczywiście jest 
to możliwe, gdy spełnione są odpowiednie warunki — zob. [Wiśniewski 2003, 
s. 413-414]). W wyniku tej operacji otrzymamy nowy e-scenariusz w oparciu 
o zbiór przesłanek będący sumą zbioru przesłanek dla scenariusza ty i zbioru 
przesłanek dla scenariusza ty (por. [Wiśniewski 2004, s. 14]). Co istotne, 
nowy e-scenariusz przedstawia zmodyfikowany plan poszukiwania odpowie¬ 
dzi dla pytania Q. Schematycznie tę operację przedstawia rysunek 3.7 (por. 
[Wiśniewski 2008]). Po lewej stronie mamy wyjściowy e-scenariusz dla py¬ 
tania Q z uwagi na zbiór formuł deklaratywnych X. Na jednej ze ścieżek 
znajduje się zapytanie Q m . Dysponujemy również e-scenariuszem dla pyta¬ 
nia Q m z uwagi na zbiór formuł deklaratywnych Y (środkowy e-scenariusz). 
Możemy wkleić e-scenariusz dla pytania Q m do wyjściowego e-scenariusza. 
W efekcie otrzymamy nowy e-scenariusz (na rysunku znajdujący się po pra¬ 
wej stronie) dla pytania Q z uwagi na sumę zbiorów formuł deklaratywnych 
X i Y. 

Przyjrzyjmy się teraz działaniu operacji wklejania na prostym przykładzie 
(por. [Wiśniewski 2004, s. 16]). Załóżmy, że dysponujemy e-scenariuszem dla 
pytania ?{p, q , r, s} — por. rysunek 3.8. Na jednej z jego ścieżek znajduje się 
zapytanie ?(uVui). Dysponujemy również drugim e-scenariuszem właśnie dla 
tego pytania (środkowy e-scenariusz na rysunku 3.8). Możemy zatem wkleić 
drugi e-scenariusz do pierwszego w miejsce zapytania ?(«Vw). Otrzymujemy 
w rezultacie e-scenariusz przedstawiający zmodyfikowany plan poszukiwania 
odpowiedzi dla pytania ?{p, q, r, s}. 

Dokładne formalne ujęcie procedury wklejania zainteresowany czytelnik 
znajdzie w [Wiśniewski 2003, s. 412-413], a także w [Wiśniewski 2004, s. 154- 
156] (w postaci reguł diagramatycznych). 

Procedura modyfikowania planów poszukiwań odpowiedzi przedstawia¬ 
nych przez e-scenariusze posiada bardzo intuicyjne motywacje. Dzięki ope¬ 
racji wklejania możliwe jest modyfikowanie pierwotnego planu poszukiwania 
odpowiedzi przy uwzględnieniu osiągniętych wcześniej wyników poszukiwań, 
nowych przesłanek itp. Ta właściwość e-scenariuszy sprawia, że wydają się 
one odpowiednie do modelowania strategii gracza V w teście Turinga. 


3.1.3. Scenariusze erotetyczne a perspektywa sędziego w TT 

Przypomnijmy, że w TTjel traktuję test Turinga jako grę składającą się 
ze skończonej liczby „rund”. Na każdą z takich rund składa się pytanie sę¬ 
dziego V oraz odpowiedź udzielona na nie przez P. W tej grze V dąży do 
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?{p, 9 , r, s} 



Rysunek 3.8. Przykład operacji wklejania jednego e-scenariusza do drugiego 


zweryfikowania prawdziwości twierdzenia zgłaszanego przez P mówiącego, 
że jest on człowiekiem. V dokonuje tej weryfikacji na podstawie odpowiedzi 
udzielanych przez P (por. rysunek 3.1). Założyliśmy na potrzeby TTiel , że 
pytania formułowane przez V nie będą przypadkowe. Naturalne wydaje się 
bowiem, że V przyjmie pewną strategię odpytywania gracza P. Przyjmijmy, 
że w tym celu V wykorzysta erotetyczne scenariusze poszukiwań. 

Aby wykorzystać e-scenariusze do opisu TT, czy też dokładniej rzecz uj¬ 
mując - do opisu TT z perspektywy sędziego, odróżnimy pytania stawiane 
sobie przez sędziego (V) od pytań zadawanych testowanemu (P) przez sę¬ 
dziego. Pytania, które stawia sobie sędzia, nie muszą być wprost komuniko¬ 
wane graczowi P (łatwo możemy sobie wyobrazić, że dość naiwne byłoby np. 
zadanie pytania: „Czy jesteś inteligentny?”). Naturalne wydaje się przyjęcie, 
że pytania, które stawia sobie sędzia w jakiś sposób będą wyznaczały pyta¬ 
nia zadawane graczowi P. Aby ściślej wyrazić tę intuicję, odwołamy się tu do 
pragmatycznej interpretacji erotetycznych scenariuszy poszukiwań. 

Zakładamy, że sędzia będzie wykorzystywał e-scenariusz jako strategię pro¬ 
wadzenia testu. Pod pojęciem strategii rozumiemy tutaj plan gry, który wy¬ 
znacza, jakie pytania i w jakiej kolejności powinien zadać sędzia graczowi 
P (por. np. [Lewin et al. 1967], [Kelly 2003]). 

Można zadać pytanie, dlaczego V miałby przyjąć jako strategię scena¬ 
riusz erotetyczny. Oczywiście nie musi on tego robić, ale użycie e-scenariusza 
będzie dla niego korzystne. Wyżej przyjąłem, że V nie będzie raczej formu¬ 
łował pytań w sposób przypadkowy i że jego kolejne pytania będą zależały 
w jakiś sposób od odpowiedzi udzielanych przez P oraz od wiedzy i przeko¬ 
nań posiadanych przez gracza V. Warunki te spełnia e-scenariusz. Dostarcza 
on V informacji mówiących, jakie pytanie powinien postawić i kiedy (czyli 
po jakiej odpowiedzi udzielonej przez P). Ponadto dobór pytań w oparciu 
o e-scenariusz gwarantuje, że będą one zadawane zawsze w związku z py- 
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taniem początkowym, uniemożliwiając „zbaczanie z tematu”. Kolejną cechą 
e-scenariuszy (w tym kontekście najważniejszą) jest to, że gwarantują one, iż 
każde postawione pytanie przybliża nas do uzyskania odpowiedzi na pytanie 
początkowe. Grając na podstawie e-scenariusza wiemy z całą pewnością, że 
odpowiedzi uzyskane na pytania cząstkowe złożą się ostatecznie na odpowiedź 
na pytanie początkowe. 

Dodatkowym argumentem na rzecz wykorzystania e-scenariuszy jako stra¬ 
tegii gry w TT jest własność opisywana przez twierdzenie o złotej ścieżce. 
W tym kontekście możemy powiedzieć, że dla strategii gry w TT określonej 
przez e-scenariusz istnieje przynajmniej jedna taka rozgrywka, która kończy 
się rozwiązaniem problemu początkowego i dodatkowo owo rozwiązanie jest 
poprawne (z uwagi na przyjęte założenia początkowe). Co więcej, możliwe 
jest w miarę proste i intuicyjne modyfikowanie pierwotnego planu poszuki¬ 
wania przedstawianego przez e-scenariusz, chociażby przy użyciu procedury 
wklejania (zobacz s. 68). 

Oczywiście należy pamiętać również o tym, że zawsze skorzystanie z na¬ 
rzędzia formalnego prowadzi do konieczności nałożenia pewnych ograniczeń 
i w konsekwencji do pewnych uproszczeń badanego zjawiska. W przypadku 
TT iel jesteśmy ograniczeni definicją implikacji erotetycznej. W zamian uzy¬ 
skujemy jednak możliwość ścisłego badania TT widzianego z perspektywy 
sędziego (oczywiście na pewnym stopniu ogólności). 

Zakładając, że sędzia będzie korzystał z e-scenariusza jako strategii w TT, 
możemy przyjąć, że odpowiednie przekonania sędziego znajdą swój wyraz 
w przesłankach rozważanego e-scenariusza. Będą to oczywiście przekona¬ 
nia sędziego odnośnie do kryteriów, które musi spełnić testowany gracz P, 
aby być uznanym za człowieka. Swoje przekonania sędzia może formułować 
w dwojaki sposób; albo będą one wyrażały warunki wystarczające „bycia 
człowiekiem”, takie że niespełnienie żadnego z nich przekona sędziego, że 
poddawany testowi nie jest człowiekiem, albo też warunki konieczne, które 
łącznie — w przekonaniu sędziego — składają się na warunek wystarczający. 

W pierwszym przypadku przesłanki będą formułowane wedle następują¬ 
cego schematu: 

„Jeżeli gracz P spełnia kryterium X , to gracz P jest człowiekiem” 

Możemy ten schemat zapisać jako B —>• A, gdzie A skraca „gracz P jest 
człowiekiem”, zaś B reprezentuje frazę „gracz P spełnia kryterium X'\ W ta¬ 
kiej sytuacji przesłanki odzwierciedlające przekonania sędziego moglibyśmy 
wyrazić za pomocą zestawu formuł o schematach: 

B\-ł A 

i?2 A 

B n —i A 

—>Bi A —ip?2 A A ~<B n —t —iA 


gdzie A jest różne od każdego Ą (1 < i < n). 
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Sędzia dysponuje w tym przypadku warunkami wystarczającymi do „bycia 
człowiekiem”, takimi że gdy żaden z nich nie jest spełniony, jest to w jego opi¬ 
nii warunkiem wystarczającym do tego, żeby uznać, że nie ma on do czynienia 
z człowiekiem. 

Z uwagi na to, że zachodzą następujące zależności: 

(1) Im(?AĄ^Ą?{Ą^4,Ą}) 

(2) Im 

możemy przejść od pytania ?A do pytania o postaci ? B, ze względu na 
odpowiednią przesłankę o postaci Bi —> A. 

Erotetyczny scenariusz poszukiwań zbudowany w oparciu o przesłanki tego 
typu podpadałby pod schemat: 


(I) 


?A 

Bi A 
B 2 —» A 


Bn —t A 

—Bi A — 'B 2 A ... A — 'B n —>■ —*A 
?{A, -*A, Bi} 

?Bi 



A ?{A,^A,B 2 } 

?b 2 



A 


1 


Bn— 1 —'Bn — 1 

A ?{A,^A,B n } 
?B n 


B n -'Bn 
A -<A 


Na przedstawionym powyżej schemacie e-scenariusza widzimy, że proce¬ 
dura postępowania sędziego jest następująca: najpierw stawia on sobie pyta¬ 
nie, czy gracz P jest człowiekiem, a następnie stawia sobie kolejno pytania 
o to, czy P spełnia kolejne kryteria „bycia człowiekiem” 4 . W sytuacji gdy 
P nie spełni żadnego z warunków, sędzia zyskuje pewność, że odpowiedź na 
główne pytanie realizowanego przez niego e-scenariusza jest negatywna. 

W drugim z rozważanych wariantów, przesłanki formułowane przez sę¬ 
dziego podpadałyby pod następujący schemat: 

„Jeżeli gracz P jest człowiekiem, to gracz P spełnia warunek X.” 


4 Zauważmy, że pytania o postaci ?{A, ~<A, Bi} nie są zapytaniami rozważanego 
e-scenariusza, lecz pełnią jedynie rolę niezbędnych przesłanek, które z jednej strony są 
(erotetycznie) implikowane, z drugiej zaś implikują (erotetycznie) odpowiednie zapytania. 
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Analogicznie do poprzedniego rozwiązania (przy czym tutaj C reprezen¬ 
tuje frazę „gracz P spełnia kryterium A”), możemy teraz przedstawić prze¬ 
konania sędziego jako zestaw formuł o schematach: 

A-MAl 

a^c 2 

A —> C n 

Ci A C 2 A ... A C n — y A 
gdzie A jest różne od każdego Ci (1 < i < n). 

Sędzia dysponuje więc warunkami koniecznymi do „bycia człowiekiem”, 
których łączne spełnienie jest w jego opinii warunkiem wystarczającym do 
bycia człowiekiem. Scenariusz, wedle którego sędzia mógłby prowadzić test, 
podpadałby pod następujących schemat: 


(II) ?A 

A-yCi 
A —> C 2 

A —> C n 

Cl A C 2 A ... A Cn —^ A 
?{A,-nĄ-,Ci) 

?Ci 

C^^Ci 

?{A,-A,^C 2 } -a 

?c 2 



C n — 1 —'Cn—l 
?{A, -iA, -'Cn} -'A 

?Cn 

CWA 

A ->A 


Zachodzą bowiem: 

(3) Im(?A, A -a Ci, ?{A, ->A, ^C}) 

(4) Im (?{A,^A,^C i },?C i ). 

Zachodzą również poniższe zależności: 

(5) Im(?A, A -a Ci, A -a C 2 ,...,A -a C n ,Ci A C 2 A ... A C n -A A, 
? ± \Ci, C 2 ,..., C n \) 

(6) Im(? ± \Ci,C 2 , ...,C n \,?Ci), gdzie 1 < i < n. 
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Przypomnijmy, że zapis ? ± \C\, Ci , C n \ oznacza pytanie koniunkcyjne 
(zob. s. 62). Rozważany e-scenariusz mógłby więc także podpadać pod sche¬ 
mat następujący: 


(III) 


?A 

A —» Ci 
A -> C 2 


A —> Cn 


Ci A C 2 ,...,C„-► A 
?±|Ci,C 2 ,...,C n | 
?Ci 



?C 2 -■A 



?C n _i 



i 


Cn ~'Cn 


A -.A 


W przypadku obu powyższych schematów procedura postępowania sę¬ 
dziego w TT polega na sprawdzeniu kolejnych warunków sformułowanych 
przez sędziego. Gdy gracz P spełni wszystkie z nich, sędzia zyskuje pewność, 
że ma do czynienia z człowiekiem. 

Warto nadmienić, że prawdopodobnie w rzeczywistym teście Turinga naj¬ 
korzystniejsze byłoby zastosowanie strategii będącej połączeniem obu przed¬ 
stawionych powyżej rozwiązań. Praktyczne zastosowanie tych rozwiązań wy¬ 
magałoby również niewątpliwie wykorzystania pewnych elementów rozumo¬ 
wania statystycznego. Takie dodatkowe reguły statystyczne mogłyby np. 
określać dopuszczalne proporcje odpowiedzi uznanych i nieuznanycli przez 
sędziego. Strategia opracowywania takich reguł mogłaby być na przykład 
wzorowana na rozwiązaniu R. Frencha zaproponowanym w [French 1996], 
a opartym na tzw. Humań Subcognitive Profile (zob. rozdział 2). Formuło¬ 
wanie takich reguł i cyzelowanie strategii sędziego w kierunku rzeczywistych, 
praktycznych zastosowań wykracza jednak poza poziom ogólności rozważań 
niniejszej pracy. 

Kolejne zapytania przedstawionych e-scenariuszy należy — jak się wydaje 

traktować jako pytania stawiane sobie przez sędziego. Jak już zauważy¬ 
liśmy wcześniej, zadawanie tych pytań graczowi P wydaje się zajęciem dość 
jałowym bowiem jeśli otrzymamy na nie odpowiedź, znaczy to tylko tyle, 
że testowany sztuczny system potrafi podać deklaracje, na podstawie których 
sędzia (w oparciu o przyjęte kryteria) wyciągnie odpowiedni wniosek. Przy¬ 
kładowo, zadanie graczowi P pytania: „Czy potrafisz odpowiedzieć na pytanie 
subkognitywne?” (por. rozdział 2) i uzyskanie od niego odpowiedzi „tak” nie 
przyniesie sędziemu wiedzy o P rzeczywiście użytecznej z perspektywy testu 
Turinga. Z tego powodu uznajemy, że pytania zadawane sobie przez sędziego 
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i w tym przypadku reprezentowane przez zapytania e-scenariuszy - je¬ 
dynie wyznaczają pytania, które sędzia zada testowanemu graczowi P. 

Aby sprecyzować owo wyznaczanie pytań przez zapytania e-scenariusza, 
dokonam pewnej operacjonalizacji. W tym celu zakładam, że sędzia przyj¬ 
muje konkretne przesłanki o schemacie: 

(*) jeśli a jest człowiekiem oraz formułuję warunek Wi (będący warunkiem 
zadania) i następnie zadaję temu a odpowiednie pytanie Qi, to a udziela 
odpowiedzi o,; na pytanie Qi. 

W powyższym schemacie przesłanki przyjmowanej przez sędziego, Oi repre¬ 
zentuje odpowiedź na pytanie Qi taką, że w opinii sędziego właśnie tej odpo¬ 
wiedzi „udzieliłby człowiek” z uwagi na warunek w i odpowiedniego zadania. 

Schemat ten będę dalej zapisywać skrótowo: 

(**) C(a) /\F(wi,a,Qi) ->U(a,Oi,Qi), 

gdzie C(a) oznacza „a jest człowiekiem”, F(wij,a, Qi) — „formułuję waru¬ 
nek Wi (będący warunkiem zadania) i następnie zadaję a pytanie Q”, zaś 
U(a, Oi , Qi ) — „a udziela odpowiedzi o,; na pytanie Qj‘. 

Zakładając, że takich przesłanek jest n (gdzie n > 1), strategia, którą 
będzie się teraz posługiwał sędzia, może się wyrażać e-scenariuszem podpa¬ 
dającym pod zaprezentowany poniżej schemat (A) 5 . 

Dzięki takiemu ujęciu możliwe jest wyraźne odróżnienie pytań zadawanych 
sobie przez sędziego od tych, które postawi on testowanemu graczowi P. 
Pytania, które zadaje sobie sędzia, to pytania ?U(a, oi, Qi ),..., ?U(a, o n ,Qn), 
zaś pytania, które postawi on graczowi P to odpowiednie pytania Q i,..., Q n . 

Analogicznej operacjonalizacji można poddać e-scenariusz o schemacie (I) 
(zob. s. 72) z tym, że przesłanki przyjmowane przez sędziego podpadałyby 
wtedy pod schemat: F(wi,a,Qi) AU (a,Oi,Qi) — >• C(a). 

Z uwagi na twierdzenie o złotej ścieżce możemy stwierdzić, że sędzia, re¬ 
alizując zaproponowany e-scenariusz, dokona trafnej identyfikacji gracza P. 
Oczywiście należy pamiętać, że stanie się tak pod warunkiem, że przesłanki 
deklaratywne tego e-scenariusza będą prawdziwe, co jest bardzo silnym zało¬ 
żeniem. 

Na tym etapie rozważań widać wyraźnie, że przebieg testu Turinga zależy 
w ogromnym stopniu od zasobu wiedzy i od przekonań sędziego. Zagadnienie 
to jest bardzo istotne dla TT (por. np. [Turing 1950, s. 442], [Newman et al. 
1952, s. 4], [Błock 19956, 378-379]). Erotetyczny scenariusz poszukiwań gwa¬ 
rantuje jedynie to, że sędzia otrzyma odpowiedź na pytanie główne realizowa¬ 
nego e-scenariusza. Nie gwarantuje prawdziwości uzyskanej odpowiedzi, ro¬ 
zumianej jako trafna identyfikacja gracza P. Trafność tej identyfikacji zależy 
w oczywisty sposób od zestawu przesłanek, na podstawie których V buduje 
e-scenariusz dla testu Turinga. 


5 W schemacie korzystamy z tego, że zachodzą relacje implikacji ( 6 ) oraz 

(7) Im(?A A A Di — y Ci, A A Z ?2 — > C *2 ,..., A A D n — y C n , Di A D2 A ... A D n , 
Ci A C 2 A ... AC„-iĄ? ± |Ci,C 2 ,...,C„|). 



76 


3. Test Turinga — perspektywa sędziego 


(A) 


?C (a) 

C(a) A F(uii, a, Q i) —s> U(a, 01, Qi) 
C(a) A F(ui2, a, Q2) —> U(a, 02, Q2) 


C(fl) A F(u>n, Gt, Qn) — ^ U((ł, On, Qn) 
F(uii,a, Qi) A ... A F(ui n , a, Q n ) 
U(a, 01, Qi) A ... A U (a, o n ,Q n —s> C (a)) 
? ± |U(a, 01, Qi), ..., U (a, o n ,Qn)\ 
?U(a, 01) 



U(a, oi,<3i) -iTJ(a, 01, Qi) 

?U(a,02,Q 2 ) -iC(a) 



?U(a, o n — 1, Q n — 1) 



U(d, On—1, 1) ^U(gł, O n — 1 , Q n — 1 ) 

?U (a,On,Qn) ~>C (a) 



U(fl, On, Qn) U(o.,On,CJn) 

C(a) -.C(a) 


Jest to oczywiście pewna słabość testu Turinga. Ma ona jednak swoje źró¬ 
dło w niejasności kryterium „bycia człowiekiem”, czy też „bycia inteligentnym” 
(w rozumieniu ludzkiej inteligencji). Problemy na tym polu doskonale od¬ 
zwierciedlają dyskusje wokół zagadnienia adekwatności testu Turinga przed¬ 
stawione w rozdziale drugim. 

Możemy sobie również wyobrazić bardziej wyrafinowaną operacjonalizację. 
Załóżmy, że sędzia jako strategie w teście Turinga przyjmuje e-scenariusz zbu¬ 
dowany w oparciu o jeden z przedstawionych w tym podrozdziale schematów 
e-scenariuszy. Obrany e-scenariusz sędzia będzie wykorzystywał w grze jako 
metascenariusz. Ten metascenariusz wyraża początkową strategię sędziego. 
Sędzia przyjmuje jednak operacyjne kryteria uznawania, że odpowiednie „kry¬ 
terium człowieczeństwa” (zawarte w przesłankach metascenariusza) jest/nie 
jest spełnione. Oznacza to, że zapytania metascenariusza nie zostaną zadane 
graczowi P. Sędzia dla każdego zapytania metascenariusza układa bowiem 
subscenariusz. Dopiero zapytania takiego subscenariusza (jako operacjonali- 
zacje konkretnych zapytań metascenariusza sędziego) zadawane są testowa¬ 
nemu graczowi. Takie rozwiązanie umożliwia sędziemu uzyskanie o graczu 
P rzeczywistych informacji, które są użyteczne z punktu widzenia przepro¬ 
wadzanego testu. Jest to możliwe dzięki konstrukcji subscenariuszy. Subsce- 
nariusze bowiem powinny być tak zbudowane, aby sprawdzać rzeczywistą 
wiedzę/umiejętności gracza P, nie zaś jego deklaracje. 
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Korzystając z przytoczonego już przykładu z umiejętnością odpowiadania 
na pytania subkognitywne, można powiedzieć, że pytanie: 

- „Czy P potrafi odpowiadać na pytania subkognitywne?” 

stanowiło będzie jedno z zapytań metascenariusza. Jego operacjonalizacją 
będzie natomiast subscenariusz zawierający takie zapytania, jak: 

- „Czy słowo Flugly nadaje się na pseudonim artystyczny gwiazdy Holly¬ 
wood?” 

- „Czy słowa Flugly można użyć jako imienia misia przytulanki?” 

- „Czy można użyć orzechów kokosowych jako instrumentów muzycz¬ 
nych?” 

- „Czy świeżo ścięta trawa ładnie pachnie?” 

Oczywiście każdy z subscenariuszy w swoich przesłankach reprezentuje 
odpowiednie przekonania sędziego odnośnie do tego, jaka odpowiedź na po¬ 
szczególne zapytania będzie satysfakcjonująca. Sędzia może dołączyć subsce- 
nariusze do metascenariusza dzięki operacji wklejania. 

Taka forma operacjonalizacji wydaje się zgodna z intuicjami przedstawio¬ 
nymi przez S. Watta we wspomnianym już artykule „Can People Think? 
Or Machines? A Unified Protocol for Turing Testing” [Watt 2009]. Skon¬ 
struowany przez niego szkic uniwersalnego protokołu przeprowadzania testu 
Turinga można by z powodzeniem uznać za podstawę dla początkowego me¬ 
tascenariusza sędziego. Poprawnie przygotowany protokół przeprowadzania 
TT stanowiłby swego rodzaju gwarancję trafnej identyfikacji gracza w teście 
Turinga. 

Przedstawiony model jest oczywiście ujęciem bardzo wstępnym, opierają¬ 
cym się w dużej mierze na sugestii A. M. Turinga mówiącej o tym, że warto 
najpierw rozważyć test Turinga z pytaniami rozstrzygnięcia. Wydaje się jed¬ 
nak, że już na tym poziomie TT jel jest użyteczny dla analiz testu Turinga. 
Jego atrakcyjność polega na naturalnym, moim zdaniem, ujęciu testu Tu¬ 
ringa jako systemu pytań i odpowiedzi oraz zastosowaniu do jego zbadania 
inferencyjnej logiki pytań. Formułując TTjel starałem się oddać z dużą do¬ 
kładnością oryginalne warunki przeprowadzania TT, skupiając się na per¬ 
spektywie sędziego w TT (która była dotychczas zaniedbywana w literaturze 
przedmiotu). Celem takiego podejścia jest analiza TT na pewnym poziomie 
ogólności (co umożliwia wykorzystanie narzędzi formalnych) przy jednoczes¬ 
nym zachowaniu intuicji związanych z testem. Ze wstępnych analiz wynika, 
że wykorzystując pragmatyczną interpretację e-scenariuszy możemy je po¬ 
traktować jako zapis strategii dla sędziego w TT. Wydaje się również, że 
wybór tak skonstruowanej strategii jest bardzo korzystny dla sędziego z po¬ 
wodu pewnych własności, które posiadają e-scenariusze. TTjel potwierdza 
również przypuszczenia N. Błocka, że dla przebiegu testu Turinga kluczowe 
znaczenie ma zasób wiedzy i przekonania, którymi kieruje się sędzia w TT. 


Rozdział 4 


Test Turinga — inspirująca gra 


We wstępie do niniejszej książki podałem długą listę dyscyplin, na których 
test Turinga odcisnął swoje piętno. Znalazły się na niej zarówno filozofia, jak 
i psychologia, a także informatyka (por. s. 8). Gdy uwzględnimy dodatkowo 
fakt, że tematyka związana z testem Turinga cieszy się nadal dużym zainte¬ 
resowaniem, możemy zaryzykować twierdzenie, że jest to jedna z najbardziej 
inspirujących znanych nam gier. 

Przedstawię tutaj pewne koncepcje oraz rozwiązania, które stanowią twór¬ 
cze rozwinięcie idei zawartych w teście Turinga. Rozdział ten podzielony jest 
na dwie części. Pierwsza z nich zawiera omówienie ciekawych propozycji za¬ 
stąpienia testu Turinga innym testem (który lepiej spełniałby zadanie wyzna¬ 
czone przez Turinga). W drugiej części przedstawiam pewną klasę systemów 
służących automatycznej autoryzacji użytkownika. Ich główne założenia bez¬ 
pośrednio odwołują się do testu Turinga. 


4.1. Wybrane propozycje alternatywne względem testu 
Turinga 

W rozdziale 2 przedstawiłem pewne próby wzmocnienia bądź osłabienia 
oryginalnej propozycji Turinga. Część badaczy skłania się jednak ku zastąpie¬ 
niu TT zupełnie nową propozycją, która będzie lepszym kryterium badania 
inteligencji systemów sztucznych. Opiszę tutaj trzy takie propozycje: Inuer- 
ted Turing Test (odwrócony TT), Lovelace Test (test lady Lovelace) oraz 
Minimum Intelligent Signal Test (MIST). 


4.1.1. Odwrócony test Turinga (Inverted TT) 

S. Watt zaproponował swój test w artykule „Naive Psychology aud the 
Inverted Turiug Test” [Watt 1996]. Konstruując odwrócony TT ( Inuerted 
Turing Test — ITT) oparł się on na idei psychologii naiwnej ( naiue psycho- 
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logy). Pojęcie psychologii naiwnej pojawiło się po raz pierwszy w artykule 
A. Clarka „From Folk Psychology to Naive Psychology” [Clark 1987]. W tym 
tekście Clark stara się wykazać, że dla zrozumienia codziennych ludzkich 
zachowań powinniśmy posłużyć się konstruktem innym, niż ten zapropono¬ 
wany przez tak zwaną psychologię potoczną (folk psychology ). Psychologia 
potoczna traktowana jest jako rodzaj prymitywnej teorii, która ujawnia się 
jedynie w praktycznym działaniu (por. [Shanahan 1999]). Zdaniem Clarka 
powinniśmy porzucić próby wyjaśniania codziennych zachowań ludzi w świe¬ 
tle tak rozumianej teorii, czyli zespołu poglądów, przekonań żywionych przez 
tych ludzi. Stąd propozycja psychologii naiwnej, wedle której psychika jest 
zespołem kompetencji kognitywnych (por. [Clark 1987, s. 146]), które wy¬ 
kształciły się i ewoluowały wraz z rozwojem społecznym człowieka (gwaran¬ 
tując szybką i efektywną współpracę w grupie). To właśnie te kompetencje 
pozwalają na zrozumienie zachowań innych. Zdaniem S. Watta system do¬ 
strzega, rozpoznaje i reaguje na stany mentalne ludzi w taki sposób, w jaki 
robi to zwykły człowiek tylko wtedy, gdy kieruje się psychologią naiwną. 
Psychologia naiwna stanowi bowiem: 

[...] naturalną ludzką tendencję i zdolność do przypisywania stanów mentalnych innym 
i sobie samym — mówiąc krótko, umiejętność rozpoznawania i rozumienia innych umy¬ 
słów [Watt 1996, s. 3]. 

Watt proponuje zatem przetestowanie maszyny pod względem zgodności 
jej zachowania z przewidywaniami psychologii naiwnej. Aby to osiągnąć, wy¬ 
starczy — zdaniem Watta — zastąpić sędziego w klasycznym teście Turinga 
maszyną. 

Zamiast rozwijać zdolność systemów do zwodzenia ludzi, powinniśmy przeprowadzić 
test który sprawdzi, czy system przypisuje inteligencję innym w taki sam sposób jak 
robią to ludzie [Watt 1996, s. 6]. 

Mamy więc do czynienia z sytuacją, w której to sędzia (z klasycznej wersji 
TT) poddawany jest testowi. Watt podkreśla, że ITT ma charakter staty¬ 
styczny. Test powinien być powtarzany wielokrotnie. Po każdej serii testów 
wyniki dla maszyny byłyby porównywane z wynikami uzyskanymi dla sę¬ 
dziego, który jest człowiekiem. 

Aby „zdać” odwrócony test Turinga system musi podlegać tym samym prawidłowościom 
i anomaliom w przypisywaniu stanów mentalnych, którym podlegałaby osoba — regu¬ 
larności i anomalie, które mogą być zbadane przez psychologię na zasadzie porównania 
[Watt 1996, s. 7[. 

Pomysł odwróconego testu Turinga skrytykował R. French w artykule „The 
Inverted Turing Test: How a Mindless Program Could Pass It” [French 1996]. 
Głównym punktem, na którym opiera on swoją krytykę, jest fakt, że ITT 
może być symulowany przy zastosowaniu układu znanego z klasycznego testu 
Turinga. Rysunek 4.1 ilustruje właśnie taki system. 

Pomysł polega na wprowadzeniu tzw. meta-sędziego. Umieszczamy sę¬ 
dziów: człowieka (Ih) oraz maszynę (Im) w oddzielnych pokojach (pokoje 
1 i 2 na rysunku). Meta-sędzia nie wie, w którym z pokojów jest Ih, a, w któ¬ 
rym Im- Sędziowie Im oraz Ih oceniają graczy znajdujących się w kolejnych 
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4. Test Turinga — inspirująca gra 



Rysunek 4.1. Symulacja odwróconego testu Turinga przy użyciu klasycznej wersji testu 
Turinga (na podstawie [French 1996]); wyjaśnienia w tekście 


pokojach (3 i 4). Im oraz Ih poddawani są tym samym odwróconemu te¬ 
stowi Turinga. Meta-sędzia wie, kto jest w pokojach 3 i 4. Przeprowadza on 
klasyczny TT, przepytując jedynie sędziów Ih oraz Im- Meta-sędzia zleca 
im następujące zadanie: „Wyobraźcie sobie, że jesteście sędziami w teście Tu¬ 
ringa. Powiedzcie mi, na podstawie odpytywania osób z pokojów 3 i 4, czy 
macie do czynienia z maszyną i człowiekiem, czy może z dwojgiem ludzi.” Na 
podstawie odpowiedzi udzielanych przez sędziów Ih i Im meta-sędzia musi 
teraz ustalić, który z nich jest człowiekiem, a który maszyną. Jeżeli werdykty 
wydane przez Im oraz Ih będą z perspektywy meta-sędziego nierozróżnialne, 
znaczyło to będzie, że maszyna (czyli sędzia Im) zdała test. 

W zaprezentowanym układzie ITT boryka się — zdaniem Frenclia — z ta¬ 
kimi samymi problemami, co oryginalny TT. ITT ograniczony jest bowiem 
do badania funkcji behawioralnych. Możemy więc wyobrazić sobie sytuację, 
w której sędzia będący maszyną (Im) oszuka meta-sędziego. Zdaniem Fren- 
cha możliwe jest opracowanie tzw. Humań Subcognitive Profile — HSP, który 
prezentuje sposób udzielania odpowiedzi na pewien zestaw pytań subkogni- 
tywinych (por. s. 41) uzyskany z dużej próbki (np. dzięki grze w ocenianie 
rating gamę). Załóżmy teraz, że w ITT zarówno Ih, jak i Im będą stosowali 
tylko pytania subkognitywne, przy czym sędziego-maszynę wyposażymy w ze¬ 
staw tych pytań oraz uzyskany dla tego zestawu HSP. Im zadaje po prostu 
pytania z posiadanej listy, po czym porównuje odpowiedzi z tymi zawartymi 
w HSP. Tym samym — zdaniem Frencha maszyna będzie osiągała takie 
same wyniki, jak sędzia-czlowiek (odpytujący z własnej listy pytań subkogni- 
tywnych). French podkreśla przy tym, że efekt taki osiągnięto dzięki prostemu 
wybiegowi. 


4.1.2. Test lady Lovelace (Lovelace Test ) 

Inną propozycję zastąpienia TT, jaką jest test lady Lovelace (Louelace Test 
LT), znajdujemy w artykule „Creativity, the Turing Test, and the (Bet- 
ter) Lovelace Test” [Bringsjord et al. 2001]. Jego autorzy zwracają uwagę na 
pewien problem zauważony już przez Turinga w „Computing Machinery.. 
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a określany jako zarzut lady Lovelace ( Lady Lovelace’s objection). Lady Lo- 
velace miała zanotować o maszynie analitycznej ( Analytical Engine) skon¬ 
struowanej przez Charlesa Babbage’a: 

Maszyna analityczna nie rości sobie pretensji do tworzenia czegokolwiek. Potrafi jedynie 

wykonywać to, o czym wiemy jak nakazać jej to wykonać [Turing 1950, s. 450]. 

Innymi słowy, komputer nie jest w stanie stworzyć niczego sam z siebie 
wykonuje jedynie program. Opierając się na tej własności maszyn cyfrowych, 
autorzy wspomnianego tekstu projektują swój test, który — ich zdaniem 
lepiej niż TT nadaje się do badania inteligencji sztucznych systemów poznaw¬ 
czych. 

Warunki pozytywnego przejścia LT są dokładnie określone (por. 
[Bringsjord et al. 2001, s. 12]). 

Zaprojektowany przez H sztuczny system poznawczy A, dający na wyjściu 
wyniki oi, 02 ,..., o n , zdaje LT wtedy i tylko wtedy gdy: 

(i) Istnieje przynajmniej jeden wynik Ok (1 < A; < n), co do którego H, 
lub ktoś o wiedzy H (oraz dysponujący równymi jemu zasobami tech¬ 
nologicznymi i ludzkimi), odwołując się do bazy wiedzy, architektury 
i bazowych funkcji A nie potrafi wyjaśnić, w jaki sposób A uzyskał 
wynik o&, oraz 

(ii) Wynik Ok nie jest rezultatem błędu, ale procesu, który A jest w stanie 
powtórzyć. 

W omawianym artykule znajdziemy również próbę doprecyzowania kwestii 
długości trwania testu oraz tego, jakimi zasobami i zakresem wiedzy może 
dysponować H. Jeśli chodzi o czas potrzebny H (do udzielenia wyjaśnienia 
wyniku uzyskanego przez ^4), to powinien mieć „[...] tyle czasu ile on, lub 
ona uważają za słuszne [...]” [Bringsjord et al. 2001, s. 9]. Oczywiście istnieje 
zdroworozsądkowa granica oczekiwania na wyjaśnienie ze strony H, za którą 
przyjmuje się w cytowanym artykule „kilka lat”. Co do zasobów i wiedzy H , 
to powinien on dysponować wiedzą dotyczącą budowy testowanego sztucz¬ 
nego systemu poznawczego (czyli wiedzą na temat jego bazy wiedzy oraz 
sposobów implementacji jego głównych funkcji). H powinien również dyspo¬ 
nować zasobami technologicznymi i ludzkimi, które pozwolą mu na zbadanie 
wymienionych elementów. 

Przykładem zadania, które można wykorzystać w LT jest gra o nazwie 
L 3 G (The Short Story Gamę). Gra ta polega na tym, że maszyna i czło¬ 
wiek dostają proste zdanie (np. cytat z Przebudzenia F. Kafki: „Gdy Gre¬ 
gor Samsa obudził się pewnego rana z niespokojnych snów, stwierdził, że 
zmienił się w łóżku w potwornego robaka” 1 * ). Ich zadaniem jest napisanie 
krótkiego opowiadania (około 500 słów) nawiązującego do tego zdania. Prace 
oceniane są pod względem wartości literackich, spójności, nowatorskości etc. 
(por. [Bringsjord 2001] oraz [Bringsjord et al. 2001]). S. Bringsjord i D. Fer - 
ruci zaprojektowali system BRUTUS, który doskonale radzi sobie w tego ty pu 


1 F. Kafka, Przebudzenie, w: Cztery opowiadania. List do ojca, tłum. J. Kydryński, 

J. Ziółkowski, PIW, Warszawa 2003. 
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grze (por. opowiadania stworzone przez ten system — [Bringsjord 2001, s. 26] 
i [Bringsjord et al. 2001, s. 14]). Nie możemy jednak powiedzieć, że BRUTUS 
przechodzi pomyślnie LT, ponieważ jego autorzy są w stanie dokładnie wytłu¬ 
maczyć, w jaki sposób system ten tworzy wspomniane opowiadania (ponieważ 
sami tworzyli i implementowali algorytmy, z których on korzysta). Tutaj wła¬ 
śnie tkwi atrakcyjność LT — nie wystarczy imitacja szeroko pojmowanych 
zachowań behawioralnych, sztuczny system poddawany testowi musi wykazać 
się kreatywnością. 

Zdaniem S. Bringsjorda, którego zainteresowania badawcze skupiają się 
na zagadnieniu maszynowej twórczości, nie jest możliwe, aby jakikolwiek 
sztuczny system zdał test Lady Lovelace. 

Prawdopodobnie nie jest możliwe aby artefakt przetwarzający jedynie informacje zdał 
LT, ponieważ to, czego szuka Lovelace wymagać może takiego rodzaju autonomii, która 
wykracza poza granice zwykłej relacji przyczynowej oraz matematyki [Bringsjord et al. 
2001, s. 25]. 


4.1.3. MIST — Minimum Intelligent Signal Test 


Minimum Intelligent Signal Test (MIST) został zaproponowany przez 
Chrisa McKinstry’ego w bardzo krótkim (zaledwie dwustronicowym) artykule 
„Minimum Intelligence Signal Test: an Objective Turing Test” [McKinstry 
1997]. Bardziej dokładny opis proponowanego testu znaleźć można w póź¬ 
niejszym tekście opublikowanym w tomie Parsing the Turing Test (por. 
[McKinstry 2009]. 

Zdaniem Ch. McKinstry’ego głównym problemem związanym z testem 
Turinga jest fakt, że dzięki niemu możemy uzyskać wyłącznie jedną z dwóch 
(możliwych) odpowiedzi na pytanie, czy dana maszyna myśli — albo będzie 
to odpowiedź twierdząca, albo przecząca. McKinstry twierdzi, że TT nie do¬ 
puszcza żadnych pośrednich możliwości. Ujmuje to w sposób następujący: 

W teście Turinga dostajemy „wszystko albo nic” i przez to jest on bezużyteczny dla 
procesu tworzenia lub dokonywania pomiaru powstających systemów inteligentnych. 
Jedyne czego może nam dostarczyć, to informacji, że stworzyliśmy taki system (ale do¬ 
piero po fakcie). Tym czego naprawdę potrzebujemy jest test podobny do testu Turinga, 
w którym uznaje się pewną stopniowalność i traktuje inteligencję jako, co najmniej, 
pewnego rodzaju kontinuum zachowań ludzkich. Potrzebujemy testu, który pozwoliłby 
nam mierzyć to minimum globalnej ludzkiej inteligencji, które stanowi podstawę dla 
wykształcenia się dojrzałej inteligencji — testu, który mógłby zostać zautomatyzowany 
i dzięki temu byłby wykonywany z prędkością dostępną maszynom [McKinstry 2009, 
s. 286]. 

Aby osiągnąć tak zamierzony efekt McKinstry proponuje, aby MIST opie¬ 
rał się na porównaniu wzorców odpowiedzi udzielanych przez ludzi, z udzie¬ 
lonymi przez sztuczny system poznawczy. Z tego powodu w MIST powinny 
pojawiać się wyłącznie pytania i zdania oznajmujące, na które można odpo¬ 
wiadać „tak” lub „nie”. Uważa on, że dzięki temu możliwe jest skoncentrowa¬ 
nie uwagi na wykrywaniu rzeczywistych, inteligentnych wzorców zachowań 
a tym samym uniknięcie problemów, z jakimi borykają się organizatorzy 
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konkursu Lobenera. W przypadku konkursu Loebnera (a także oryginalnego 
TT) złożoność reakcji na bodźce testowe może wprowadzić sędziego w błąd. 
Ponadto praca sędziego nie daje się w nich zautomatyzować — a przez to 
wynik testu może być nietrafny z powodu niedoskonałości sędziego-człowieka 
(por. rozdział 3). W MIST odpowiedzi na bodźce testowe są skrajnie ogra¬ 
niczone, co ma gwarantować, że „kandydaci [testowani — przyp. P.Ł.] nie 
mogą udzielać odpowiedzi wymijających, mogą jedynie odpowiadać w sposób, 
w jaki odpowiadają ludzie lub nie” [McKinstry 2009, s. 289]. Zdaniem McKin- 
stry’ego do wykorzystania w MIST doskonale nadają się zadania zapropono¬ 
wane przez R. Frencha w jego „grze w ocenianie” (por. [French 1990] oraz 
rozdział 2.3.1.2), np. „Czy »Flugly« byłoby dobrym nazwiskiem aktorki?”, 
a także zdania typu: „Istnieję”, „Jesteś skalą”, „Nie jesteś człowiekiem” (por. 
[McKinstry 2009, s. 290]). 

Kolejnym, kluczowym elementem propozycji McKinstry’ego jest wykorzy¬ 
stanie pojęcia prawdopodobieństwa w ocenianiu wyników MIST, a także 
przyjęcie, że wynik testu będzie informował jedynie o stopniu podobień¬ 
stwa między wzorcem inteligentnych odpowiedzi udzielanych przez ludzi 
a wzorcem odpowiedzi uzyskanym od maszyny. Procedurę testowania wy¬ 
obraża sobie McKinstry w sposób następujący (por. [McKinstry 1997, s. 17], 
[McKinstry 2009, s. 288]): 

1. Generowane jest N bodźców testowych (pytań i zdań oznajmujących). 
Bodźce te powinny być tak ułożone, aby ludzie (czy też bardziej reali¬ 
stycznie — pewna populacja ludzi) byli w stanie odpowiednio na nie za¬ 
reagować. Dodatkowo — o czym była mowa powyżej przyjmuje się, 
że reakcje te powinny mieć „binarny” charakter (czyli sprowadzać się 
do potwierdzenia lub zaprzeczenia). Na około 50% bodźców ludzie po¬ 
winni reagować twierdzeniem, a na drugą część zaprzeczeniem. W tym 
kroku zbiera się również odpowiedzi na przygotowane bodźce testowe 
(w tym celu powinno zaangażować się jak najliczniejszą populację lu¬ 
dzi). W efekcie otrzymujemy bazę zawierającą dane zorganizowane na 
zasadzie bodziec testowy — odpowiedź, która posłuży ocenie wyników 
MIST. 

2. Przygotowane bodźce testowe prezentuje się testowanemu podmiotowi 
w losowej kolejności i rejestruje się jego odpowiedzi. 

3. Ocenia się zestaw zebranych odpowiedzi na bodźce testowe, porównując 
je z danymi zebranymi w pierwszym etapie procedury. McKinstry su¬ 
geruje, aby ten proces zautomatyzować, dzięki czemu uniknie się stron¬ 
niczości i błędów ze strony sędziego porównującego dwa zestawy zebra¬ 
nych danych. 

4. Im większy procent zgodności odpowiedzi udzielonych przez testowany 
system poznawczy z odpowiedziami zebranymi w pierwszym kroku, tym 
lepszy wynik tego podmiotu w MIST. McKinstry przyjmuje, że zgod¬ 
ność na poziomie 50% mogą osiągnąć podmioty odpowiadające w spo¬ 
sób losowy. Tym samym interesujące wyniki powinny być znacznie wyż¬ 
sze od tej dolnej granicy. 
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McKinstry w 2000 roku rozpoczął prace nad Mindpixel Digital Mind Mo- 
deling Project. Celem było stworzenie systemu, który mógłby przeprowadzić 
MIST. Niestety, projekt został wstrzymany po śmierci jego autora w 2006. 

Zarówno odwrócony test Turinga, jak i test lady Lovelace oraz MIST 
stanowią bardzo interesujące alternatywy dla testu Turinga. Warto jednak 
zauważyć, że omówione propozycje również należałoby uznać za testy wej¬ 
ścia/wyjścia (por. [Crockett 1994]). W tym sensie nawiązują one bezpośred¬ 
nio do idei testu Turinga — proponują pewne zawężone kryterium posia¬ 
dania inteligencji. Dodatkowo owo kryterium bazuje na porównaniu działań 
(czy też raczej efektów działań) takiego systemu z podobnymi działaniami 
wykonywanymi przez ludzi. Dzięki temu ITT, LT oraz MIST dają nadzieję 
na praktyczną realizację, w odróżnieniu od propozycji skomplikowania testu 
Turinga opisanych w rozdziale drugim. 


4.2. Praktyczna realizacja idei TT — systemy 
CAPTCHA 

4.2.1. Systemy CAPTCHA — charakterystyka 

Powszechny dostęp do globalnej sieci Internet stanowi niewątpliwie krok 
naprzód w dziedzinie komunikacji, jednocześnie jednak stwarza równie ogromny 
problem zapewnienia bezpieczeństwa owej komunikacji. Jedna z głównych za¬ 
let Internetu - - szeroko zakrojona automatyzacja komunikacji jest również 
jednym z najbardziej oczywistych i najgoręcej dyskutowanych zagrożeń: ko¬ 
rzystając z Internetu, chcielibyśmy mieć pewność, że dane, które przesyłamy 
lub udostępniamy w globalnej sieci, nie zostaną wykorzystane przez osoby do 
tego niepowołane. Dotyczy to przede wszystkim następujących dziedzin wy¬ 
miany i udostępniania danych w sieci WWW (por. [Bergmair, Katzenbeisser 
2004], [Chew, Baird 2003], [Naor 1996], [Rui, Liu 2004]): 

Darmowe konta e-mailowe. Specjalnie skonstruowane programy (boty) 
rejestrują tysiące darmowych kont, aby później rozsyłać z nich spam lub 
wirusy komputerowe. 

Serwisy udostępniające darmowe usługi. Część firm oferuje nieodpłatne 
korzystanie z pewnych usług, np. wyszukiwarek, ofert, katalogów, a także 
z meta-usług, takich jak programy umożliwiające porównywanie cen 
u różnych producentów. Dostarczenie tego typu usług jest dla firmy 
kosztowne, ale spełnia swój konkretny marketingowy cel: przyciąga 
i wiąże klienta z daną firmą. Sytuacja ta zmienia się, gdy ktoś wy¬ 
korzystuje — dostarczane nieodpłatnie — dane i usługi dla własnych 
korzyści. 

- Serwisy, w których liczy się liczba przeprowadzanych przez użytkownika 
transakcji, wizyt itp. Jeżeli pozycja i uprawnienia użytkownika zależą od 
pewnego wskaźnika, którym jest, powiedzmy, liczba wizyt na określonej 
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stronie WWW, to chcielibyśmy mieć pewność, że użytkownik ten jest 
konkretną osobą, nie zaś botem. 

- Wszelkiego rodzaju głosowania online. Aby zapewnić wiarygodność 
wyników musimy zagwarantować, że glosowali będą ludzie, a nie skon¬ 
struowane dla tego celu automaty 2 . 

- Prywatność i ograniczony dostęp do danych. Serwisy oferujące możli¬ 
wość zabezpieczenia danych loginem i hasłem powinny mieć możliwość 
rozpoznania prób skorzystania z takich danych przez niepowołanego 
użytkownika. 

Jak łatwo zauważyć, wymienione zagadnienia wiążą się z problemem 
automatycznego rozpoznania czy system ma do czynienia z człowiekiem, czy 
ze specjalnie skonstruowanym programem komputerowym. Taki właśnie cel 
stawia się przed systemami określanymi jako CAPTCHA ( Completely Auto¬ 
matic Public Turing Test to Tell Computers and Humans Apart). 

Systemy CAPTCHA są szczególną klasą protokołów określanych nazwą 
Humań Interactiue Proofs (HIP). Protokół HIP można najogólniej scharak¬ 
teryzować jako taki rodzaj dowodu interakcyjnego (por. [Goldwasser et al. 
1985], [Papadimitriou 2002]), który człowiek może z łatwością skonstruować, 
zaś maszyna nie może tego zrobić z równą łatwością (por. [Chew, Baird 
2003]). Z tego właśnie powodu protokoły HIP są szczególnie przydatne w sy¬ 
tuacji, kiedy potrzebujemy przyjaznego użytkownikowi narzędzia autoryzacji, 
pozwalającego dodatkowo na odrzucanie wszelkich prób autoryzacji ze strony 
programów komputerowych. Do tego celu wykorzystuje się właśnie systemy 
CAPTCHA. 

Za „ojca” CAPTCHA uważa się Moni Naora. W opublikowanym jedynie 
w Internecie tekście „Verification of a Humań in the Loop or Identification 
via the Turing Test” jako pierwszy zaproponował on wykorzystanie idei te¬ 
stu Turinga oraz trudnych problemów z dziedziny sztucznej inteligencji do 
automatycznego rozpoznawania użytkowników-ludzi 3 . 

Już sama nazwa: Completely Automatic Public Turing Test to Tell Com¬ 
puters and Humans Apart wskazuje na podstawowe cechy tej klasy proto¬ 
kołów HIP. Są one zautomatyzowane, ponieważ mają być przeprowadzane 
przez komputer wyposażony w specjalny program komputerowy. Określane 
są mianem testu Turinga, ponieważ ich celem jest trafne zidentyfikowanie 
użytkownika, który jest człowiekiem. CAPTCHA zakorzenione są więc w idei 
TT. Zwraca się jednak uwagę, że — podczas gdy TT oparty jest na dialogu 

2 W tym kontekście często przytacza się przykład głosowania zorganizowanego w 1999 r. 
przez serwis http://slashdot.com. Była to forma rankingu pod hasłem: „Która uczelnia 
kształci najlepszych informatyków?”. Każdy mógł oddać głos na swoją uczelnię (zwyciężała 
ta z nich, która zbierze ich najwięcej). Już pierwszego dnia studenci Carnegie Mellon 
University napisali program głosujący po tysiąckroć na ich uczelnię. Następnego dnia to 
samo zrobili studenci z MIT. Głosowanie przerodziło się w zmagania botów. Końcowy 
wynik to 21 156 głosów oddanych na MIT, 21 032 głosy oddane na CMU (podczas gdy na 
inne uczelnie oddano — w tradycyjny sposób — poniżej 1 000 głosów). 

3 Co ciekawe, nazwa CAPTCHA pojawiła się dopiero później. M. Naor nazywa swoją 
propozycję po prostu „zautomatyzowanym testem Turinga”. Interesujący nas rodzaj sys¬ 
temów bywa również nazywany „odwrócony test Turinga” (reverse Turing test ) — por. 
[Kochański et al. 2002], 
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CAPTCHA mogą mieć również inny charakter. Najogólniej CAPTCHA 
określa się następująco (por. [Alin et al. 2003, s. 3], [von Ahn et al. 2008]): 
CAPTCHA jest protokołem kryptograficznym, którego konstrukcja oparta 
jest na pewnym trudnym problemie z dziedziny sztucznej inteligencji (SI) 4 . 

Nie każdy problem z dziedziny SI nadaje się do wykorzystania w dzie¬ 
dzinie bezpieczeństwa. Potrzebny jest bowiem sposób na zautomatyzowanie 
procesu generowania kolejnych wersji zadań testowych. Co więcej, gotowy 
system musi być tak przyjazny użytkownikowi, jak to tylko możliwe (zwa¬ 
żywszy na praktyczne wykorzystanie systemów CAPTCHA). Przez przyja- 
zność dla użytkownika rozumie się tutaj głównie takie skonstruowanie zadań 
testowych, aby ich rozwiązanie nie wymagało odwoływania się do wiedzy fa¬ 
chowej, a także aby wymagało ono minimalnych nakładów pracy. Zazwyczaj 
przyjmuje się, że poziom, w jakim dany system CAPTCHA realizuje wy¬ 
mienione postulaty znajduje swoje odzwierciedlenie w czasie rozwiązywania 
poszczególnych zadań testowych, ich poprawności, a także liczbie powtórzeń 
dla pojedynczego użytkownika. Zwraca się również uwagę na składane przez 
użytkowników deklaracje dotyczące np. subiektywnego poczucia trudności 
zadań. Warto podkreślić, że zagadnienie użyteczności systemów CAPTCHA 
nabiera coraz większego znaczenia w obliczu rosnącej liczby ich zastosowań 
w Internecie (por. np. [May 2005], [Yan, El Ahmad 20086], [Vora 2009]). 

Ponadto na CAPTCHA nakłada się warunek publiczności , który oznacza, 
że zarówno kod programu, jak i dane, które ów program wykorzystuje po¬ 
winny być publicznie dostępne. Motywacją jest zapewnienie większego bez¬ 
pieczeństwa — CAPTCHA musi być tak skonstruowany, żeby nawet przy 
publicznym dostępie do informacji na jego temat nie można było napisać 
programu, który go złamie. Jak łatwo zauważyć, kluczowe jest tu dobranie 
odpowiednio trudnego problemu z dziedziny SI (por. [Ahn et al. 2004]). 

Jako najistotniejsze wymienia się następujące cechy systemów CAPTCHA 
(por. [Naor 1996, s. 2]; [Baird et al. 2003, s. 159]): 

1. Kolejne zadania testowe są generowane automatycznie. 

2. Test może zostać szybko rozwiązany przez użytkownika, który jest czło¬ 
wiekiem. 

3. Test przechodzą jedynie ludzie (bez konieczności odwoływania się do 
specjalistycznej wiedzy). 

4. Testu nie są w stanie zdać automaty (boty). 

5. Test nie deaktualizuje się w obliczu zmian w technologii i metodach 
programistycznych (pomimo publicznego dostępu do algorytmów owego 
testu) 5 . 

Zwraca się również uwagę na fakt, że rolę sędziego w CAPTCHA speł¬ 
nia nie człowiek, jak w TT, ale maszyna. Na pierwszy rzut oka stanowi to 


4 Formalne ujęcie problematyki CAPTCHA — sformułowane w ramach teorii dowodów 
interakcyjnych — zainteresowany czytelnik znajdzie w [Ahn et al. 2003]. 

5 To założenie jest oczywiście nieco idealizacyjne. Systemy CAPTCHA opierają się 
bowiem na trudnych problemach z dziedziny SI, ale są to problemy, z jakimi boryka się 
ta dyscyplina na chwilę obecną, a które w przyszłości mogą zostać rozwiązane — por. np. 
algorytm Mori i Malik opisany w tym rozdziale. 
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nawiązanie do idei odwróconego testu Turinga autorstwa S. Watta (por. roz¬ 
dział 4.1.1). Nie powinniśmy jednak zapominać o tym, że ów sędzia (będący 
programem przeprowadzającym test) posiada wiedzę (czy też może raczej 
umiejętność) dostępną jedynie człowiekowi, ale zaimplementowaną w progra¬ 
mie w celu automatyzacji przeprowadzania testu. Analogia z odwróconym 
testem Turinga jest więc tutaj jedynie powierzchowna. Istotną różnicą pomię¬ 
dzy CAPTCHA a TT jest to, że TT składa się z całej serii zadań stawianych 
przez sędziego maszynie, zaś w przypadku CAPTCHA — z racji ich przezna¬ 
czenia użytkowego — sędzia prezentuje jedno zadanie i tylko na podstawie 
niego musi zadecydować czy ma do czynienia z człowiekiem, czy z botem. 

M. Naor w tekście, w którym zawarł ideę CAPTCHA, wymienił kilka 
problemów z dziedziny SI, które jego zdaniem mogłyby służyć jako podstawa 
do skonstruowania systemu CAPTCHA (por. [Naor 1996, s. 2-3]): 

1. Rozpoznawanie płci. Zadaniem użytkownika byłoby tutaj określenie płci 
osoby na zdjęciu. 

2. Rozpoznawanie wyrazu twarzy. Na podstawie zdjęcia twarzy należy 
określić, w jakim nastroju jest przedstawiona osoba. 

3. Odnajdywanie części ciała. Na zdjęciu (przedstawiającym na przykład 
zwierzę) należałoby wskazać kliknięciem myszki część ciała, o wskazanie 
której proszony jest użytkownik. 

4. Określanie nagości. Na dwóch zdjęciach prezentowane są osoby. Użyt¬ 
kownik ma rozpoznać, która z nich jest rozebrana. 

5. Rozpoznawanie schematycznych rysunków. Użytkownikowi prezentuje 
się bardzo schematyczny rysunek (np. rysunek autorstwa dziecka). 
Zadanie polega na wybraniu jednej z pięciu nazw określających, co jest 
na rysunku. 

6. Rozpoznawanie pisma odręcznego. Przedstawione słowo napisane ręcz¬ 
nie (z dodanym tłem) należy wpisać w przygotowane pole. 

7. Rozpoznawanie mowy. Zadaniem użytkownika jest rozpoznanie nagra¬ 
nych słów i wpisanie ich w przygotowane pola. 

8. Praca ze zdaniami. Jedną z propozycji jest, aby zadaniem użytkownika 
było poskładanie zdania z porozrzucanych słów. Drugą, aby test polegał 
na uzupełnianiu zdania wyrazem z listy. 

9. Radzenie sobie z wieloznacznością słów. Oto przykład: zadanie testowe 
składałoby się z dwóch zdań, np. „The dog killed the cat. It was taken 
to the morgue”. Zadaniem użytkownika jest określenie do czego odnosi 
się słówko „it” w drugim zdaniu. 

Realizacji doczekało się niewiele z tych propozycji, co zapewne spowodo¬ 
wane jest wymaganiami stawianymi przed systemami CAPTCHA. Systemy 
te, po pierwsze, muszą być bezpieczne, ale nade wszystko — i to jest czyn¬ 
nikiem decydującym o ich atrakcyjności - muszą być przyjazne użytkowni¬ 
kowi. 


4. Test Turinga — inspirująca gra 


4.2.1.1. Rozpoznawanie obrazu (OCR CAPTCHA) 

Jednym z problemów z zakresu SI, który najlepiej (jak dotąd) sprawdzał 
się jako podstawa do projektowania systemów CAPTCHA jest OCR ( opti- 
cal character recognition), szczególnie zaś problem rozpoznawania obiektu 
w tle ( object recognition in scenes) (por. [Mori, Malik 2003]). Zazwyczaj tego 
rodzaju systemy CAPTCHA generują obrazek, zawierający napisy umiesz¬ 
czone na w pewien sposób zakłóconym tle. Zadaniem poddawanego te¬ 
stowi jest rozpoznanie owych słów i wpisanie ich w przygotowane wcześniej 
pole. Innym podejściem jest wykorzystanie obrazków lub zdjęć. Od użyt¬ 
kownika wymaga się tutaj rozpoznania tego, co przedstawia dana ilustracja 
lub jej szczegół. Omówię tu pokrótce wybrane popularne propozycje CAPT¬ 
CHA wykorzystujące problem OCR: PessimalPrint , Gimpy , BajfleText, Pix, 
ARTiFACIAL. 

PessimalPrint. System ten został zaproponowany w [Baird et al. 2003]. 
Tworząc kolejne zadania testowe, system wybiera losowo: 

— słowo (z ustalonej listy), 

parametry czcionki: krój, rozmiar, styl (z ustalonej listy), 

zbiór metod zniekształcania (ze z góry określonego zakresu metod, do 

którego należą m. in. rozmywanie oraz progowanie 6 ). 

Korzystając z tych trzech elementów, system generuje jeden czarno-biały ob¬ 
razek. System dysponuje listą 70 angielskich słów, o długości od 5 do 8 liter. 
Słowa wybrane są spośród najczęściej używanych w Internecie. Zbiór stoso¬ 
wanych zniekształceń jest dobrany ze względu na problemy, z jakimi nie radzą 
sobie systemy OCR. Najogólniej mówiąc, celem zastosowania zniekształceń 
jest imitowanie fizycznych zniszczeń tekstu, które powstają podczas kopiowa¬ 
nia lub skanowania tekstów. Stosowane metody zniekształceń to na przykład: 

zwężanie obrazu, tak aby powstało wrażenie zlewania się poszczególnych 
znaków, 

dodawanie szumu (rozmaitych zakłóceń) do obrazu, 
użycie czcionek o wąskich krojach, 

— użycie czcionek o pochylonych krojach. 

Przykładowe zadanie wygenerowane przez system PessimalPrint przedsta¬ 
wia rysunek 4.2. 

Autorzy PessimalPrint przeprowadzili testy systemu z wykorzystaniem 
programów OCR (Expervision TR, ABBYY FineReader oraz IRIS Reader). 
Wyniki tych testów przedstawiają się bardzo obiecująco: z 685 wygenerowa¬ 
nych wyrazów, Expervision TR w całości rozpoznał tylko 0,29% z nich, zaś 
pozostałe dwa programy nie rozpoznały żadnego ze słów. Niestety, autorzy 
nie przeprowadzili żadnych eksperymentów z udziałem ludzi, które mogłyby 
wykazać, że — pomimo dużych zniekształceń — tekst jest dla nich łatwo czy¬ 
telny. Stanowi to warunek praktycznego wykorzystania sytemu CAPTCHA 
(na co wskazują losy opisanego poniżej systemu Gimpy). 

6 Progowanie ( thresholding ) służy do konwersji rysunku do czerni i bieli (bez wykorzy¬ 
stania odcieni szarości). 
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Rysunek 4.2. Przykładowe zadania wygenerowane przez system PessimalPrint (por. 
[Baird et al. 2003]) 


Gimpy. Ten system CAPTCHA również opiera się na wprowadzaniu znie¬ 
kształceń do tekstu. Gimpy dysponuje słownikiem składającym się z 850 an¬ 
gielskich słów. System korzysta z programu Gimp oraz zestawu czcionek Free 
Type. Używane są różne rodzaje zniekształceń: 

manipulowanie tłem (dodawanie siatki tła, gradientu), 

- rozmywanie, 

dodawanie szumu, 
deformacje kształtu tekstu. 

System wybiera 7 słów ze swojego słownika i wykorzystuje je do przy¬ 
gotowania obrazka testowego. Użytkownik musi rozpoznać trzy z siedmiu 
zaprezentowanych słów. Rysunek 4.3 przedstawia przykłady testów wygene¬ 
rowanych przez system Gimpy. 

Gimpy był przez krótki czas używany przez portal Yahoo! Okazało się 
jednak, że jest on oceniany przez użytkowników jako zbyt trudny. Gimpy 
zastąpiony został łatwiejszym CAPTCHA — EZ Gimpy , w którym wymaga 
się rozpoznania tylko jednego słowa (por. rysunek 4.4). Stanowi to doskonały 
przykład tego, że systemy CAPTCHA powinny spełniać dwa kryteria — dla 
maszyn powinny być trudne, ale jednocześnie powinny być jak najłatwiejsze 
i jak najmniej kłopotliwe dla użytkownika. Tutaj uwidacznia się wyzwanie, 
jakie stoi przed projektantami systemów CAPTCHA, którzy muszą pogodzić 
ze sobą oba te warunki. 

BaffleText. Zaproponowany w [Cliew, Baird 2003], stanowi pewną inno¬ 
wację w stosunku do CAPTCHA typu Gimpy czy PessimalPrint. Autorzy 
BaffleText zdecydowali się bowiem na wykorzystanie ciągów znaków, które 
nie są angielskimi słowami (warunkiem jest to, żeby owe ciągi znaków da¬ 
wały się w miarę łatwo wymówić). Motywacją takiego kroku była zbyt duża 
przewidywalność poprzednich systemów, wynikająca z małego słownika słów 
angielskich (często wybieranych spośród słów najczęściej pojawiających się 
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Rysunek 4.3. Przykłady testów wygenerowanych przez system Gimpy. Użytkownik musi 
rozpoznać trzy z siedmiu zaprezentowanych na obrazku słów. Źródło: www.captcha.net 



Rysunek 4.4. Przykładowe zadanie EZ Gimpy. Źródło: www.captcha.net 


w Internecie). Procedura tworzenia testu BaffieText jest następująca (por. 
[Chew, Baird 2003, s. 5]): 

1. Wygenerowanie ciągu znaków, który nie jest angielskim słowem (ale 
bardzo przypomina jakieś słowo), np.: obviouse, alued, emperly , magine, 
ourses , thates (5 do 8 znaków). 

2. Wybranie jednej z wielu dostępnych czcionek. 

3. Wygenerowanie ciągu znaków przy użyciu wybranej czcionki utwo¬ 
rzenie w rezultacie obrazka. 

4. Wygenerowanie maski obrazu (czyli dodatkowej warstwy obrazu). 

5. Wybranie jednej z operacji obróbki maski obrazu. 

6. Połączenie warstw obrazu (ciągu znaków i maski). 

Rysunek 4.5 przedstawia etapy tworzenia zadania poprzez dodawanie za¬ 
kłóceń do obrazka ze słowem testowym. 

Decyzja o wykorzystywaniu ciągów znaków zamiast rzeczywistych słów 
jest niewątpliwie dużą zaletą systemu (ze względu na poziom bezpieczeń¬ 
stwa), ale i jego największą słabością. Podobieństwo „słów” testowych do rze¬ 
czywistych słów może powodować liczne pomyłki. Powodem może być tutaj 
wskazywany przez psychologię poznawczą efekt przewagi słowa nad literami 
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Rysunek 4.5. Etapy tworzenia przykładowego testu BaffleText [Chew, Baird 2003] 


(word superiority effect). Zjawisko to przejawia się na przykład w podświa¬ 
domym uzupełnianiu brakujących liter w wyrazie, a nawet całych wyrazów, 
których brakuje w zdaniu, tak aby uzyskać sensowną całość (por. [Nęcka et al. 
2006, s. 316-317]). Autorzy BaffteText przeprowadzili badania na 33 osobach 
(pracownikach firmy PARC). Badani rozwiązali w sumie 1212 testów. 79% 
z nich zostało rozwiązanych poprawnie. Mierzono również średni czas roz¬ 
wiązania zadań. Dla odpowiedzi poprawnych wynosił on 6, 6 sekundy, zaś dla 
odpowiedzi niepoprawnych był wyraźnie dłuższy i wynosił 15 sekund. Wy¬ 
daje się, że to właśnie efekt przewagi słowa nad literami jest odpowiedzialny 
za stosunkowo długi czas rozwiązania zadania (należało przecież rozpoznać 
tylko jedno słowo) 7 . Ciekawym elementem badania był formularz badający 
akceptację użytkownika dla systemu BaffleText (wypełniło go 18 z 33 osób 
badanych). Pytania koncentrowały się wokół deklarowanej chęci używania 
systemu. I tak: 

- 3 osoby wyraziły chęć rozwiązywania testu BaffleText każdorazowo, 
kiedy wysyłają pocztę elektroniczną. 

7 osób wyraziło chęć rozwiązywania testu Baffle Text każdorazowo, kiedy 
wysyłają pocztę elektroniczną, pod warunkiem, że dziesięciokrotnie 
zmniejszy to liczbę przychodzącego spamu. 

16 osób wyraziło chęć rozwiązywania testu BaffleText każdorazowo przy 
rejestrowaniu się na stronie internetowej związanej z handlem elektro¬ 
nicznym ( e-commerce ). 


7 Pewien wpływ na długość rozwiązania zadania mógł mieć czas wpisywania rozwią¬ 
zania w przygotowane do tego celu pole. Taki pomiar czasu w sytuacji badania nie jest 
zbyt korzystny, ponieważ nie mówi nam ile tak naprawdę zajęło badanemu odczytywanie 
znaków. M. Chew i H. S. Baird niestety nie podają w swoim tekście tego, czy „czas rozwią¬ 
zania” jest łącznym czasem rozwiązania zadania (na które składa się również wpisywanie 
rozpoznanych znaków), czy etap wpisywania został w jakiś sposób odjęty. 
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- 17 osób wyraziło chęć rozwiązywania testu BaffleText każdorazowo przy 
rejestrowaniu się na stronie internetowej wymagającej podania pouf¬ 
nych informacji. 

- 18 osób wyraziło chęć rozwiązywania testu BajfleText każdorazowo przy 
rejestrowaniu darmowego konta poczty elektronicznej. 

Badania tego typu są z pewnością bardzo potrzebne w kontekście wszystkich 
systemów CAPTCHA (obok sprawdzania, jak z rozwiązywaniem testów radzą 
sobie ludzie i programy). Pozwalają one bowiem na przynajmniej częściową 
odpowiedź na pytanie o przyjazność projektowanego systemu dla użytkow¬ 
nika. 

Część badań nad systemami CAPTCHA skupia się raczej na rozpozna¬ 
waniu pewnych obiektów niż słów. Motywacją jest tutaj zapewne większa 
łatwość rozwiązywania takich zadań z perspektywy użytkownika, który jest 
człowiekiem. Omówimy tutaj dwie propozycje tego typu: system ESP-PIX 
oraz system ARTiFACIAL opierający się na unikatowej zdolności człowieka 
do rozpoznawania twarzy (por. [Nęcka et al. 2006, s. 313-314]). 

ESP-PIX. W CAPTCHA ESP-PIX zadanie polega na rozpoznaniu obiektu 
wspólnego dla wyświetlanych obrazków. Przykład takiego zadania przed¬ 
stawia rysunek 4.6. System dysponuje dużą bazą etykietowanych obrazków, 
które przedstawiają jakiś konkretny przedmiot. Generowanie zadania polega 
na losowym wybraniu i wyświetleniu czterech obrazków, na których znaj¬ 
duje się ten sam przedmiot. System pyta użytkownika „o czym są te obrazki”. 
Odpowiedź należy wybrać z przygotowanej listy (w celu zminimalizowania 
możliwości pojawienia się wieloznaczności odpowiedzi). 



Rysunek 4.6. Przykład zadania wygenerowanego przez system ESP-PIX. Źródło: 
www.captcha.net 


Pewną modyfikację systemu ESP-PIX stanowi AnimaEPix. Wykorzystuje 
się tutaj zniekształcone zdjęcia (por. rysunek 4.7) dwudziestu zwierząt (m.in. 
niedźwiedzia, krowy, psa, słonia, konia, kangura, lwa, małpy, świni i węża). 
Użytkownik proszony jest o wybranie jednej z przygotowanych etykiet dla 
wyświetlanego obrazka. 

Systemy typu ESP-PIX są bardzo przyjazne użytkownikowi. Ich rozwią¬ 
zanie jest łatwe i nie zajmuje dużo czasu. Pewnym problemem jest jednak 
ich efektywna implementacja. Zagrożeniem dla bezpieczeństwa systemu jest 
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Rysunek 4.7. Przykład testu Animal-Pix [Ahn et al. 2003] 


tutaj konieczność etykietowania każdego z obrazków w bazie danych. Można 
więc sobie wyobrazić napisanie programu, który będzie rozwiązywał zadania 
testowe generowane przez ESP-PIX w oparciu o bazę danych systemu (która 
zgodnie z zasadami CAPTCHA powinna być ogólnodostępna). W pewnym 
stopniu zabezpieczeniem jest wprowadzenie losowych zniekształceń wybiera¬ 
nych każdorazowo obrazków (tak jak w Animal-Pix), aby utrudnić ich roz¬ 
poznanie systemom OCR (por. [Ahn et al. 2004, s. 59]). 

ARTiFACIAL. System zaproponowany w [Rui, Liu 2004], ARTiFACIAL 
oznacza Automated Reverse Turing test using FACIAL features. Zadaniem 
użytkownika jest rozpoznanie na obrazku testowym twarzy oraz wskazanie na 
niej sześciu punktów: lewego i prawego kącika obu oczu oraz lewego i prawego 
kącika ust. System generuje zadanie testowe w kilku krokach (por. rysunek 
4.8). Najpierw — wykorzystując trójwymiarowy model ludzkiej twarzy — 
przygotowuje obraz zawierający pewne wybrane elementy twarzy (ii oraz 
J 2 ). Kolejnym krokiem jest wygenerowanie tła z powtarzających się kopii 
zniekształconej twarzy (Iz). W ostatnim kroku łączy się wszystkie obrazy 
w jeden, który będzie zadaniem testowym. Każde takie zadanie zawiera tylko 
jedną twarz przedstawioną w całości. 

Autorzy ARTiFACIAL przeprowadzili próbne ataki na swój system, wy¬ 
korzystując systemy automatycznego rozpoznawania twarzy oraz systemy 
rozpoznające jej elementy. Wyniki osiągnięte przez programy nie były impo¬ 
nujące. Na przykład system rozpoznawania elementów twarzy — na 1000 za¬ 
prezentowanych zadań testowych (przy założeniu, że twarz została już wska¬ 
zana na obrazku) - - rozpoznał wszystkie sześć punktów do wskazania jedynie 
w dwóch przypadkach! Zadania ARTiFACIAL są więc niewątpliwie trudne 
dla maszyn, ale czy są jednocześnie łatwe dla człowieka? Y. Rui i Z. Liu prze¬ 
prowadzili również badania mające odpowiedzieć na to pytanie. Wzięły w nim 
udział 34 osoby, z których każda rozwiązała po 10 testów. Średni czas rozwią¬ 
zania poszczególnych zadań testowych wynosił od 11 do 22 sekund. Zwraca 
uwagę stosunkowo długi czas rozwiązania zadania. Wynika on niewątpliwie 
z wymagań, jakie stawia ARTiFACIAL użytkownikowi. Najpierw musi wy¬ 
dobyć twarz z bardzo mylącego tła, a później wskazać na niej aż sześć punk¬ 
tów. Tło zastosowane w ARTiFACIAL może stanowić źródło wielu pomyłek. 
W [Nęcka et al. 2006] znajdziemy opisy eksperymentów z zakresu psycholo- 
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c d 

Rysunek 4.8. Kolejne fazy generowania testu ARTiFACIAL: (a) / 1 . (b) 1 2 , (c) 73 , (d) go¬ 
towy test [Rui, Liu 2004] 


gii poznawczej, w których najpierw prezentowano badanym całą twarz do 
identyfikacji, później jej fragmenty oraz twarze zniekształcone (np. z oczami 
umieszczonymi na wysokości ust, z minimalnie zmienionymi proporcjami twa¬ 
rzy). Zaobserwowano, że w drugim przypadku badani mają bardzo duże pro¬ 
blemy z rozpoznaniem nawet znanych sobie twarzy (por. [Nęcka et al. 2006, 
s. 314], por. też [Stanford, Web 2006, s. 344-345]). Tym bardziej zaskaku¬ 
jące są wyniki uzyskane w badaniach ARTiFACIAL: na 340 testów badani 
błędnie rozpoznali twarz tylko w jednym z nich. Niestety Y. Rui i Z. Liu 
nie publikują w swoim artykule kompletu obrazków testowych, a jedynie ten 
z błędnie zidentyfikowaną twarzą, nie ma więc żadnej możliwości porównania 
ich trudności. Problemem w systemie ARTiFACIAL jest konieczność dopusz¬ 
czenia drobnych błędów w kroku drugim (to znaczy we wskazywaniu sześciu 
punktów na odnalezionej twarzy). Badani wskazywali bowiem zadane punkty 
z pewną dozą niedokładności, co zapewne wynikało z zakłóceń wprowadza¬ 
nych przez tło. 

Mimo obiecujących wyników wydaje się, że praktyczne wykorzystanie sys¬ 
temu ARTiFACIAL może być kłopotliwe. Świadczy o tym poziom skompli¬ 
kowania zadań (znajdujący swoje odzwierciedlenie w przedstawionych przez 
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autorów średnich czasach rozwiązania zadań). Przeciętny użytkownik może 
uznać za zbyt pracochłonne zadanie, polegające na rozpoznaniu twarzy 
i wskazywaniu na niej aż sześciu punków. Wystarczy porównać trudność za¬ 
dań generowanych przez Gimpy (wskazywane przez użytkowników jako zbyt 
trudne) z obrazkami testowymi ARTiFACIAL , aby przekonać się, że te drugie 
są znacznie bardziej wymagające. 


4.2.1.2. Inne typy CAPTCHA 

Oczywiście systemy CAPTCHA, oparte na problemie OCR, nie wyczer¬ 
pują całej gamy możliwości konstrukcji tego typu testów. CAPTCHA może 
być również zaprojektowany w oparciu o inne otwarte problemy z dziedziny 
sztucznej inteligencji. 

Jednym z nurtów badań jest próba stworzenia systemu CAPTCHA opar¬ 
tego jedynie na tekście (główną motywacją jest tu wygoda i użyteczność 
wdrażania takiego testu do praktycznych zastosowań). Przykładem takiego 
systemu może być CAPTCHA autorstwa R. Bergmaira oraz S. Katzenbeis- 
sera [Bergmair, Katzenbeisser 2004]. System ten wykorzystuje zjawisko wie¬ 
loznaczności pewnych słów w zależności od kontekstu. Zadanie polega na wy¬ 
braniu ze zbioru zdań tych, które możemy sobą zastępować bez utraty sensu. 
Przykładowe zadanie wygenerowane przez ten system przedstawia rysunek 
4.9. Warto zaznaczyć, że tekst prezentowany jest bez żadnych dodanych za¬ 
kłóceń czy zniekształceń (inaczej niż w przypadku CAPTCHA opartych na 
problemie OCR). 


Pick the sentences that are meaningful replacements of each other: 

The speech has to move through several morę drafts. 

The speech has to run through several morę drafts. 

The speech has to go through several morę drafts. 

The speech has to impress through several morę drafts. 

The speech has to strike through several morę drafts. 


Rysunek 4.9. Przykład tekstowego CAPTCHA [Bergmair, Katzenbeisser 2004] 


Podejmowane są również próby stworzenia dźwiękowych systemów CAPT¬ 
CHA (por. [Ahn et al. 2004, s. 59-60], [Kochański et al. 2002]). Idea pozo¬ 
staje podobna jak w przypadku testów opartych na rozpoznawaniu obrazu, 
ale tym razem mamy do czynienia z próbką dźwiękową, na którą nakładana 
jest „maska” z innych dźwięków (np. losowo odtwarzanych wybranych słów 
z danego słownika). 

Łatwo zauważyć, że CAPTCHA tego typu są znacznie trudniejsze z per¬ 
spektywy użytkownika niż te oparte na OCR. Tekstowe CAPTCHA wyma¬ 
gają od użytkownika stosunkowo dużego nakładu pracy i często — tak jak 
w przypadku systemu opisanego w [Bergmair, Katzenbeisser 2004] dosko- 
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nalej znajomości języka. W przypadku dźwiękowych CAPTCHA konieczne 
jest posiadanie odpowiedniego sprzętu (choćby słuchawek lub głośników). Są 
to z pewnością powody tego, że dotychczas największą popularnością cieszą 
się CAPTCHA oparte na OCR, zaś pozostałe stanowią zazwyczaj propozycje 
teoretyczne. Stanowi to motywację dla nurtu badań mających na celu popra¬ 
wienie bezpieczeństwa CAPTCHA opartych na problemie OCR bez zwięk¬ 
szania stopnia ich trudności dla użytkowników-ludzi. Jedną z rozważanych 
możliwości jest dodanie do problemu OCR jakiegoś dodatkowego zadania, 
które nie utrudni rozwiązania ludziom, ale sprawi, że całość będzie bardziej 
problematyczna dla botów. W tym nurcie tworzone są na przykład tzw. „Math 
CAPTCHA”. W CAPTCHA tego typu obrazek testowy zawiera zadanie ma¬ 
tematyczne. Użytkownik musi więc najpierw rozpoznać tekst, a następnie 
rozwiązać zadanie matematyczne i podać wynik. Przykład takiego zadania 
(pozyskany z www.php-help.ro/examples/math_captcha_image/) przedsta¬ 
wiony jest na rysunku 4.10. Niestety, problem leżący u podłoża tego typu 
systemów CAPTCHA nie jest trudny dla maszyn. Samo odczytanie zdegra¬ 
dowanego obrazka nie stanowi zbyt dużego problemu, zaś rozwiązanie zada¬ 
nia polegającego np. na dodaniu dwóch liczb jest dla komputera trywialne 
(należy tu podkreślić, że w Math CAPTCHA nie mogą pojawić się bardziej 
wyrafinowane zadania matematyczne, ponieważ będą one zbyt kłopotliwe dla 
ludzi). 


7 + 5 

Rysunek 4.10. Przykładowe zadanie Math CAPTCHA 

W tym kontekście naturalne wydaje się szukanie inspiracji dla systemów 
CAPTCHA wśród wyższych poziomów przetwarzania informacji przez ludzi. 
Jako przykłady takich systemów można wymienić między innymi: 

ARTiFACIAL, w którym wykorzystuje się ludzką łatwość rozpoznawa¬ 
nia twarzy (por. [Rui, Liu 2004]). 

- ESP-PIX , gdzie dla rozwiązania konieczne jest skojarzenie cechy wspól¬ 
nej czterem obrazkom (por. [Ahn et al. 2003]). 

- Egglue CAPTCHA, gdzie użytkownik musi uzupełnić zdanie, w którym 
brakuje czasownika, tak aby to zdanie miało sens 8 . 

- SemCAPTCHA, w którym, aby podać rozwiązanie, użytkownik musi 
najpierw rozpoznać trzy wyrazy, następnie odnaleźć wzorzec, zgodnie 
z którym zostały one dobrane i wskazać to, które nie pasuje do pozosta¬ 
łych (por. [Łupkowski, Urbański 2008a], [Łupkowski, Urbański 2008&]). 

Problemy leżące u podłoża wymienionych systemów CAPTCHA (dodane 
niejako do problemu OCR) z całą pewnością nie są trywialne dla maszyn. 


8 Por. http://code.google.eom/p/egglue/ 
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Jak wskazują badania związane z tymi propozycjami systemów CAPTCHA, 
dodatkowe elementy implementowane w tych systemach nie stanowią jedno¬ 
cześnie zbyt dużego obciążenia dla użytkowników. Można więc zaryzykować 
twierdzenie, że wytyczają one nowe drogi rozwoju — tak obecnie popularnych 
— systemów CAPTCHA. 


4.2.2. Dlaczego warto konstruować CAPTCHA? 

Jednym z powodów, dla którego warto konstruować systemy CAPTCHA są 
zapewne korzyści praktyczne oraz szerokie spektrum zastosowań tych syste¬ 
mów opisane w rozdziale 4.2.1. W kontekście pytania, będącego tytułem tego 
podrozdziału, wskazuje się jednak częściej na pozytywny wpływ systemów 
CAPTCHA na rozwój badań z zakresu sztucznej inteligencji. W [Ahn et al. 
2003] znajdziemy następującą opinię na ten temat: 

Ważną składową sukcesu współczesnej kryptografii jest przyjęta na jej gruncie praktyka 
formułowania w sposób bardzo przejrzysty i jasny warunków, przy których możemy 
uznać pewne protokoły kryptograficzne za bezpieczne. Praktyka ta pozwala wspólnocie 
uczonych na ewaluację owych założeń i próby ich złamania. W przypadku sztucznej inte¬ 
ligencji, bardzo rzadko zdarza się, żeby problemy były tak precyzyjnie sformułowane, ale 
wykorzystanie ich do celów bezpieczeństwa wymusza na projektantach protokołów ową 
precyzję sformułowań. Jesteśmy przekonani, że precyzyjne ujęcie nierozwiązanych pro¬ 
blemów SI może przyspieszyć rozwój sztucznej inteligencji [...] [Ahn et al. 2003, s. 295]. 

Przykładem mogą tu być CAPTCHA oparte na problemie OCR. Ich od¬ 
czuwalna obecność w Internecie wymusiła niejako próby złamania tego typu 
zabezpieczeń. Powstało wiele prac, których autorzy prezentują techniki i pro¬ 
gramy rozwiązujące tego typu zadania. Warto tu wspomnieć choćby o kilku 
z nich. Mori i Malik w artykule „Recognizing Objects in Adversarial Clut- 
ter: Breaking a Visual CAPTCHA” [Mori, Malik 2003] opisują swój atak na 
CAPTCHA Gimpy i EZ-Gimpy. W pierwszym przypadku udało im się po¬ 
prawnie rozwiązać 33% zadań testowych, w drugim aż 92%. G. Moy i współ¬ 
pracownicy [Moy et al. 2004] osiągnęli 99% poprawnie rozwiązanych zadań 
dla systemu Gimpy. Z kolei Yan i Ahmad [Yan, El Ahmad 2008a] opisali 
prostą metodę segmentacji, która umożliwiła złamianie CAPTCHA używa¬ 
nego przez Microsoft (60% poprawnie rozwiązanych zadań). Powstają rów¬ 
nież prace, w których przedstawiane są wyniki zastosowania bardzo prostych 
technik analizy obrazu do łamania systemów CAPTCHA opartych na OCR 
(por. m.in. [Yan, El Ahmad 2007], [Yan, El Ahmad 2009], [Łupkowski 2009]). 
Ciekawy jest również fakt, że obok wspomnianych prac, których celem jest 
wykazanie nieskuteczności CAPTCHA opartych na problemie OCR, zaczęto 
również zwracać uwagę na zagadnienia związane z użytecznością tych syste¬ 
mów (por. np. [May 2005], [Yan, El Ahmad 2008 6], [Vora 2009]). 

Oczywiście badacze zajmujący się projektowaniem systemów CAPTCHA 
nie pozostają w tyle. Na rynku CAPTCHA pojawiają się coraz to nowe 
rozwiązania, które częstokroć czerpią inspiracje z dziedzin wychodzących 
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4. Test Turinga — inspirująca gra 


poza OCR. Jedną z zasadniczych cech CAPTCHA jest to, że test pozostaje 
aktualny, pomimo zmian w technologii i metodach programistycznych oraz 
publicznego dostępu do algorytmów owego testu. Takie założenie wręcz pro¬ 
wokuje swoistą grę w „kotka i myszkę” pomiędzy twórcami CAPTCHA a ba¬ 
daczami ulepszającymi algorytmy rozwiązujące otwarte problemy SI. CAPT¬ 
CHA stanowią więc pewnego rodzaju motywację do działania i okazję do 
precyzowania problemów, z jakimi boryka się dyscyplina określana mianem 
sztucznej inteligencji. Dobrze zaprojektowany (czyli precyzyjnie ujmujący pe¬ 
wien otwarty problem) system CAPTCHA generuje prostą sytuację: albo 
CAPTCHA nie zostaje złamany (i wtedy może służyć jako zautomatyzo¬ 
wany test Turinga), albo zostaje złamany, a tym samym zostaje rozwiązany 
otwarty problem, na którym system ten został oparty. 


Aneks 


Alan Mathison Turing (1912-1954) 


Rodzice Alana Turinga — Julius Mathison oraz Ethel - przez większą 
część swojego dorosłego życia mieszkali w południowych Indiach. Julius Ma¬ 
thison był bowiem urzędnikiem Indyjskiej Służby Cywilnej. W Indiach uro¬ 
dził się starszy brat Alana — John (w 1908 roku). Rodzice zdecydowali jed¬ 
nak, że ich drugie dziecko powinno przyjść na świat na Wyspach Brytyjskich. 
I tak Alan Mathison Turing urodził się 23 czerwca 1912 roku w Londy¬ 
nie. Jeszcze w tym samym roku rodzice Alana powrócili do Indii pozosta¬ 
wiając obu synów pod opieką państwa Ward (zamieszkujących miejscowość 
St Leonards-on-Sea nieopodal Hastings). Julius M. Turing dopiero w 1929 
roku przeszedł na emeryturę i na stale osiadł na Wyspach Brytyjskich. 

W 1926 roku Alan został przyjęty do publicznej szkoły Sherborne w Dor- 
set. Po jej ukończeniu został przyjęty w roku 1931 do King’s College w Cam¬ 
bridge. Studia ukończył z wyróżnieniem w 1934. W 1935 otrzymał stypen¬ 
dium King’s College. Prawdopodobnie to wykłady z podstaw matematyki 
prowadzone w 1935 roku przez M. H. A. Newmana sprawiły, że skupił on 
swoją szczególną uwagę na zagadnieniu rozstrzygalności (por. [Hodges 1992, 
s. 90], [Hodges 1998, s. 12] [Hodges 2003]). Efektem podjętych prac był arty¬ 
kuł o ogromnym znaczeniu w dorobku naukowym A. M. Turinga: „On com- 
putable numbers, with an application to the Entscheidungsproblem ”, który 
ukazał się w Proceedings of the London Mathematical Society w roku 1937 
(został on wysłany do publikacji w 1936 r.) 1 . To właśnie w tej pracy Tu¬ 
ring formułuje ideę abstrakcyjnej maszyny znanej dziś jako Maszyna Turinga 
(MT) 2 . 

MT możemy sobie wyobrazić jako maszynę posiadającą — podzieloną na 
komórki — taśmę (nieskończoną w prawo 3 ) oraz głowicę, która może w do¬ 
wolnej chwili obserwować tylko jedną komórkę taśmy. Każda z komórek może 
zawierać tylko jeden ze skończonej liczby symboli taśmowych. Działanie MT 


1 Warto zaznaczyć, że w 1936 r. wyniki o podobnej wymowie ogłosi! w pracy „An 
unsolvable problem in elementary number theory” Alonzo Church (por. s. 45 oraz 47). 

2 Maszyna Turinga była jednym z kilku równoważnych modeli obliczania zdefiniowanych 
w tamtym okresie (por. [Papadimitriou 2002, s. 68]). 

3 Tym terminem wyraża się fakt, że taśma MT posiada swój początek (skrajną lewą 
komórkę) ale — potencjalnie — nie posiada skrajnej prawej komórki. 
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Aneks. Alan Mathison Turing (1912-1954) 


określone jest przez „program” nazywany sterowaniem skończonym , na które 
składa się skończony zbiór stanów i zbiór przejść ze stanu do stanu, zacho¬ 
dzących przy różnych symbolach wejściowych odczytywanych z taśmy MT 
(por. [Hopcroft, Ullman 2003, s. 29]). Zgodnie z bieżącym stanem sterowania 
skończonego oraz symbolem obserwowanym przez głowicę taśmy MT może 
w pojedynczym ruchu (por. [Hopcroft, Ullman 2003, s. 173]): (1) zmienić 
stan, (2) wydrukować symbol w obserwowanej komórce taśmy, zastępując 
nim symbol uprzednio tam zapisany 4 , (3) przesunąć głowicę o jedną komórkę 
w prawo, lewo lub pozostawić głowicę bez ruchu. Czytelnika zainteresowanego 
tematyką Maszyn Turinga odsyłamy do pozycji wymienionych w bibliografii, 
np. [Alio et al. 2003], [Hopcroft, Ullman 2003] lub [Papadimitriou 2002]. 

W „On Computable Numbers...” Turing wykorzystuje model obliczania, 
jakim jest Maszyna Turinga, do zmierzenia się z problemem sformułowanym 
przez Davida Hilberta — czy istnieje efektywna procedura (algorytm), która 
pozwoliłaby na rozstrzygnięcie zdania matematycznego (w tradycji niemiec¬ 
kojęzycznej problem ten znany jest właśnie jako Endscheidungsproblem). Tu¬ 
ring udziela negatywnej odpowiedzi na pytanie o istnienie takiej procedury. 
Dziś powszechnie akceptowalnym modelem formalnym procedury efektywnej 
jest właśnie Maszyna Turinga (por. [Hopcroft, Ullman 2003, s. 172]). 

W latach 1936-1938 Turing kontynuował swoje badania, przebywając na 
Uniwersytecie w Princeton w USA. Tam pod kierunkiem A. Cliurcha przy¬ 
gotował i obronił w czerwcu 1938 roku dysertację doktorską z logiki mate¬ 
matycznej, która rok później ukazała się w Proceedings of the London Ma- 
thematical Society pod tytułem „System of Logic Based on Ordinals” [Turing 
1939], 

W roku 1938 wraca do King’s College w Cambridge. Warto wspomnieć, że 
w tym samym roku Turing uczęszczał na wykłady prowadzone w Cambridge 
przez Ludwiga Wittgensteina dotyczące podstaw matematyki 5 . W tym sa¬ 
mym roku rozpoczyna również współpracę z Government Codę and Cypher 
School (GC&CS). 

Wraz z wybuchem drugiej wojny światowej Turing zostaje zatrudniony 
przez GC&CS w ośrodku Bletchely Park, gdzie ma zająć się problemem zła¬ 
mania kodu niemieckiej maszyny szyfrującej Enigma. Podobno Alan Turing 
był jednym z dwóch pracowników, którzy wierzyli w możliwość złamania 
kodu Enigmy (drugim był szef sekcji szyfrów marynarki Frank Brich). Bricli 
uważał, że złamanie kodu Enigmy jest po prostu konieczne, tymczasem Tu¬ 
ring chciał się po prostu zmierzyć z wyzwaniem, które powszechnie uważane 
było za bardzo trudne (por. [Oakley, Gallehawk 2007, s. 69]). Opierając się 
na wcześniejszych dokonaniach polskiego wywiadu oraz wynikach osiągnię¬ 
tych przez polskich kryptologów (szczególnie Mariana Rejewskiego, Jerzego 
Różyckiego i Henryka Zygalskiego) osiągnął on znaczne sukcesy na tym polu. 
Prawdopodobnie bazując na polskim projekcie urządzenia do automatyzacji 


4 Zakłada się tutaj istnienie symbolu pustego, którym oznaczone są niezapisane komórki 
taśmy. 

5 Atmosferę owych wykładów, prowadzonych raczej w formie grupy dyskusyjnej niż tra¬ 
dycyjnego wykładu uniwersyteckiego, doskonale oddaje książka Davida Edmondsa i Johna 
Eidinowa Pogrzebacz Wittgensteina [Edmonds, Eidinow 2002], 
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procesu dekryptażu depesz Enigmy (tzw. „bomba” autorstwa M. Rejewskiego) 
Turing zaprojektował elektryczno-mechaniczne urządzenie nazwane w Blet- 
chley „pająkiem” (dzisiaj znane raczej jako „bomba Turinga” lub „bomba 
Turinga-Welchmana”). Szczegóły dotyczące konstrukcji Enigmy oraz opis za¬ 
wiłej drogi wiodącej do złamania jej kodu zainteresowany Czytelnik znajdzie 
np. w [Oakley, Gallehawk 2007] i w [Karbowski 2006, rozdz. 1], 



Rysunek 1. Pomnik Alana Turinga w Bletchely Park. Fot. Jon Callas 


Już w trakcie prac w ośrodku w Bletchley Park Turing rozpoczął ba¬ 
dania nad jak to określał inteligencją maszyn. Dziś moglibyśmy je 
z powodzeniem zaliczyć do pierwszych badań nad sztuczną inteligencją (por. 
[Copeland, Proudfoot 2009]). Niestety, szkic artykułu, który Turing przed¬ 
stawił do dyskusji swoim współpracownikom zaginął. 

W 1945 roku Alan Turing otrzymał Order Imperium Brytyjskiego (Order 
of the British Empire ). 

Po zakończeniu wojny Turing został zatrudniony w National Physical La- 
boratory (NLP) w Londynie. Z uwagi na jego doświadczenie nabyte w Blet¬ 
chley, powierzone mu zostaje zadanie zaprojektowania pierwszego komputera 
cyfrowego ogólnego przeznaczenia (a więc maszyny, którą można programo¬ 
wać). Z zadania tego Turing wywiązał się bardzo szybko, przedstawiając w ra- 
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Aneks. Alan Mathison Turing (1912-1954) 


porcie „Proposed electronic calclulator” z 1946 roku projekt komputera o na¬ 
zwie Automatic Computer Engine (ACE) 6 . W literaturze przedmiotu zwraca 
się uwagę na fakt, że projekt Turinga był zadziwiająco szczegółowy (Turing 
oszacował nawet cenę zbudowania swojego komputera) i zawierał bardzo no¬ 
watorskie idee. Podkreśla się również to, że Turing już od samego początku 
prac nad swoim projektem twierdził, że dwa aspekty będą kluczowe dla każdej 
budowanej maszyny cyfrowej: prędkość działania i zasoby pamięciowe (por. 
[Copeland, Proudfoot 2000, s. 491]). Z przyczyn od Turinga niezależnych, 
jego oryginalny projekt nie został zrealizowany. Na jego podstawie w NPL 
skonstruowano jednak między innymi - dostępny komercyjnie komputer 
DEUCE. 

W trakcie pracy w NPL narasta jego frustracja związana z tym, że w tym 
czasie jego osiągnięcia z Bletchley pozostawały utajnione. Dodatkowo prace 
NPL zostają w tym czasie przyćmione przez amerykański projekt budowy 
komputera. W tym czasie Turing szuka odskoczni od pracy naukowej w upra¬ 
wianiu sportu (biega w maratonach). W 1948 roku niemalże został zakwali¬ 
fikowany do reprezentacji Wielkiej Brytanii na olimpiadę. 

W maju 1948 roku otrzymał propozycję z Uniwersytetu w Mancheste¬ 
rze, którą przyjął. Pracował tam do końca swojej kariery akademickiej. Jego 
pierwszym zadaniem było opracowanie systemu programowania dla kompu¬ 
tera Ferranti Mark I (komercyjnie dostępnego komputera produkowanego 
przez Uniwersytet w Manchesterze — sprzedano dziesięć sztuk tej maszyny, 
por. [Copeland, Proudfoot 2000, s. 492]). Ukończył je w 1951 roku. Warto 
nadmienić, że ulubionym problemem, który Turing rozważał w kontekście 
programowania komputerów, była gra w szachy. Turing zaczął nawet pisać 
program do gry w szachy — Turochamp — dedykowany dla komputera Fer¬ 
ranti Mark I. Co prawda nigdy go nie ukończył, ale sam program zasługuje na 
zainteresowanie z uwagi na wykorzystanie w nim różnego rodzaju heurystyk 
(co było w owym czasie nowatorskim podejściem do problemu). 

W 1948 roku sporządził raport zatytułowany „Intelligent Machinery” (skan 
oryginalnego maszynopisu dostępny jest w Digital Turing Archiue [Turing 
1948]). Pierwsze zdanie tej pracy brzmi: „Proponuję rozważyć pytanie o to, 
czy jest możliwe aby maszyny przejawiały inteligentne zachowania” [Turing 
1948, s. 1]. Raport ten postrzegany jest jako pierwszy manifest idei ba¬ 
dań nad sztuczną inteligencją (por. [Copeland 2000], [Copeland, Proudfoot 
2009]). W „Intelligent Machnery” Turing wprowadza wiele propozycji rozwią¬ 
zań, które dzisiaj stanowią już rozwiązania klasyczne w ramach dyscypliny 
sztucznej inteligencji. Badacze wkładu Alana Turinga w rozwój tej dyscy¬ 
pliny — J. Copeland i D. Proudfoot — podkreślają, że znajdziemy w tym 
raporcie zagadnienia związane z koneksjonizmem, algorytmami genetycznymi 
oraz dowodzeniem twierdzeń (por. m.in. [Copeland, Proudfoot 2000, s. 495]). 

W 1950 roku, w czasopiśmie Mind ukazuje się artykuł „Computing Machi¬ 
nery and Intelligence” zawierający propozycję znaną dzisiaj jako test Turinga. 
Jak komentuje A. Hodges: 


6 Skan oryginalnego raportu dostępny jest w Turing Digital Archiue (AMT/C/32). 
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Problem napisania tekstu przeznaczonego dla czytelników bez przygotowania matema¬ 
tycznego Turing rozwiązał z właściwą sobie zimną krwią, ignorując wszelkie konwencjo¬ 
nalne bariery kulturowe. Pozbawiony jakichkolwiek odwołań do literatury z dziedziny 
filozofii czy psychologii, artykuł Turinga jest bezkompromisowy zarówno pod względem 
stylu, jak i zawartości [Hodges 1998, s. 56]. 

Warto podkreślić, że również w tym artykule odnajdujemy bardzo nowa¬ 
torską (jak na tamte czasy) propozycję skonstruowania uczących się maszyn 
(w paragrafie 7). Turing pisze: 

Zamiast próbować wyprodukować program symulujący umysł osoby dorosłej powinni¬ 
śmy raczej spróbować wyprodukować taki program, który symulowałby dziecięcy umysł 
[...] Tym samym dzielimy problem na dwie części. Program-dziecko ( child-programme) 
oraz proces nauczania. Obydwa pozostają ze sobą w ścisłym związku. Nie możemy 
oczekiwać że otrzymamy dobry progam-dziecko już przy pierwszej próbie. Należy eks¬ 
perymentować z procesem nauczania takiej maszyny i obserwować jak się ona uczy. 
Następnie należy wypróbować inne metody, sprawdzając, czy są one lepsze czy gorsze 
[Turing 1950, s. 456]. 

W dalszej części artykułu Turing szegółowo opisuje i dyskutuje metody, 
jakich można by użyć w uczeniu maszynowym. 

Tematyka związana z inteligentnymi maszynami zajmuje stale miejsce 
w aktywności naukowej Turinga. Warto wspomnieć tu chociażby „Can Di¬ 
gital Computers Think” (wywiad radiowy wyemitowany w 1951 roku), „In- 
telligent Machinery, a Heretical Theory” (wykład wygłoszony w roku 1951), 
„Can automatic calculating machines be said to think?” (wywiad radiowy wy¬ 
emitowany w 1952 roku) oraz „Digital Computers Applied to Games” (tekst 
z tomu Faster than thought pod redakcją B.V. Bowdena, który ukazał się 
w 1953 roku). 

W 1951 roku Turing zostaje wybrany członkiem Królewskiej Akademii 
Nauk ( Fellow of the Royal Society) w uznaniu wyników przedstawionych 
w „On Computable Numbers...” 

W tym samym czasie zainteresowania Turinga zaczynają również oscylo¬ 
wać wokół biologii i chemii. Interesuje go możliwość modelowania procesów 
biologicznych przy użyciu maszyn cyfrowych (wykorzystuje do tego komputer 
Ferranti Mark I). Wyniki swoich pionierskich prac prezentuje w artykule „The 
Chemical basis of morphogenesis”, który ukazał się w Philosophical Transac- 
tions of the Royal Society of London [Turing 1952]. 

Niestety, w wyniku nieszczęśliwego zbiegu okoliczności w 1952 roku został 
aresztowany i oskarżony o homoseksualizm (który w owym czasie był w Wiel¬ 
kiej Brytanii przestępstwem). Po przyznaniu się do „winy”, został poddany 
przymusowej kuracji hormonalnej, która miała „wyleczyć” go ze „złych skłon¬ 
ności”. Jednocześnie odsunięto go od wszystkich prac związanych z projek¬ 
tami rządowymi. Żyjąc w izolacji od świata naukowego, zmagał się ze skut¬ 
kami kuracji hormonalnej. 7 czerwca 1954 roku w swoim domu w Wilmslow 
(Cheshire) popełnił samobójstwo, zjadając jabłko zatrute cyjankiem. 

10 września 2009 roku premier Wielkiej Brytanii Gordon Brown — w od¬ 
powiedzi na kampanię społeczną zainspirowaną przez J. G. Cumminga — na 
łamach gazety Telegraph przeprosił za to, w jaki sposób został potraktowany 
Alan Turing. Napisał m.in.: 
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Aneks. Alan Mathison Turing (1912-1954) 


Był on jedną z tych postaci, których indywidualne zaangażowanie pomogło zmienić 
bieg wojny. Dług wdzięczności wobec niego sprawia, że nieludzki sposób, w jaki został 
potraktowany wydaje się być jeszcze bardziej przerażający. [...] Turing został skazany 
zgodnie z obowiązującym w tym czasie prawem i nie możemy cofnąć czasu, ale sposób, 
w jaki został potraktowany był oczywiście rażąco niesprawiedliwy. Dlatego też cieszę 
się, że mam szansę wyrazić to, jak bardzo mi przykro z powodu tego wszystkiego co go 
spotkało 7 . 


7 Pełny tekst dostępny jest pod adresem http://tinyurl.com/37934qf. 
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